일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- ETRI
- 한국전자통신연구원 인턴
- cnn
- ggplot2
- dx
- 다변량분석
- Ai
- 에트리 인턴
- 에이블러
- SQL
- 프로그래머스
- r
- 시각화
- 에이블스쿨
- ML
- 가나다영
- arima
- 웹크롤링
- SQLD
- kaggle
- 머신러닝
- KT 에이블스쿨
- 하둡
- matplot
- 서평
- 빅분기
- 소셜네트워크분석
- python
- httr
- Eda
- 한국전자통신연구원
- 지도학습
- hadoop
- 기계학습
- 딥러닝
- 하계인턴
- 빅데이터분석기사
- 시계열
- kt aivle school
- KT AIVLE
- Today
- Total
목록자격증 (27)
소품집
작업형 1 유형 score 값이 null 이 아닌 행만 가져와서 이상치에 해당하는 데이터 수 구하기 StandardScaler 적용해서 몇 이상인 데이터 수 구하기 df에서 가장 큰 상관관계를 갖는 컬럼명을 찾고, 그 컬럼의 평균 구하기 작업형 2 유형 회귀모델 구축하기 (평가지표: RMSE) 간단하게 GridSearch 해서 RF 돌렸음. 데이터 전처리에서는 결측치는 없었고 컬럼 더미화만 했음 작업형 3 유형 로지스틱 회귀 모형 구축 회귀 모형 구축 제 기억에는 위 문제 유형이었고, 1, 2 유형은 쉬웠는데 3이..ㅎ t-test나 chisquare anova 가 하나도 안나오고 모형 구축이어서 아쉬웠습니다.. help 쓰면서 푸는 내가 얼마나 킹받던지요... 붙은 것 같고 다음 8회차 응시하는 분들 ..
t-test 단일표본 t-검정 from scipy.stats import ttest_1samp # 귀무가설 : 평균키는 165이다 # 대립가설 : 평균키는 165가 아니다 # 1. 정규성을 만족하는가? # 2. ttest_1samp shapiros, p = shapiro(df) print(p) # 정규성을 갖지 않음! s, p, _ = ttest_1samp(df['height'], 165) print(p) # p-value는 0.0001로 대립가설을 채택한다. #따라서 평균키는 165가 아니다. 2. 대응(쌍체) 표본 t-검정 from scipy.stats import ttest_rel # 귀무가설: 혈류량의 변화가 있다 # 대립가설 : 혈류량의 변화가 없다 # 1. 정규성을 만족하는가? shapiro ..
https://www.datamanim.com/dataset/03_dataq/typetwo.html 작업 2유형 (파이썬) — DataManim 참고 모든 문제의 y_test값은 해당 url에서 y_test로 불러와 확인가능합니다. 실제로 제출을 위해 만든 데이터의 예측 점수를 확인해보세요 www.datamanim.com 작업형 2 유형은 분류/회귀 중 랜덤으로 나오고, 모듈 자동완성이 안되기 때문에..^^ 패키지까지 싸악 외워야한다! 간단한 데이터 전처리 및 모델 구축과 평가로 간단하게 진행하면 될 것 같다. (외워) 풀어보겠습니다~! 분류 (Classification) 1. 서비스 이탈 예측 데이터 import pandas as pd from sklearn.ensemble import RandomFo..
https://www.datamanim.com/dataset/99_pandas/pandasMain.html 판다스 연습 튜토리얼 — DataManim Question 43 df의 데이터 중 new_price값이 lst에 해당하는 경우의 데이터 프레임을 구하고 그 갯수를 출력하라 lst =[1.69, 2.39, 3.39, 4.45, 9.25, 10.98, 11.75, 16.98] www.datamanim.com 위 블로그는 빅분기 시험범위가 바뀐 시험 범위를 기준으로 기출 문제를 공유해주고 있어서 보고있는 블로그다. 작업형 1유형 데이터 전처리 문제를 풀어보겠습니다~! # 1. 롤 랭킹 데이터 1. 인기동영상 제작 횟수가 많은 채널 상위 10개명 (날짜 기준, 중복 포함) top_channel = df['..
DAsp 따려고 알아보다가 보수교육 있던 거 생각나서 봤더니 3개월 남았네요. 😅 아예 잊고있다가 자격증 취소되는 사람 될 뻔 ㅎ 다들 꼭 보수교육 들으세용
과락!!!!!!!!!과락은 처음이다 제대로 오답풀이를 해보겠습니다~ 1과목 01. 다음은 무엇에 대한 설명인가?[보기]1) 각 속성이 가질 수 있도록 허용된 값들의 집합이다. 2) 릴레이션에서 원자값(atomic)을 가져야 한다. 3) 실제 속성값의 합법 여부를 시스템이 검사하는데 이용된다.4) 속성명과 반드시 동일할 필요는 없다. 1) 카디널리티 (Cardinality)2) 도메인 (Domain)3) 인스턴스(Instance)4) 차수 (Degree) // 난 이 문제에서 보기 2) 4)번에서 도메인이라고 인식하지 못했다 .[해설] 도메인은 하나의 속성이 가질 수 있는 모든 원자값들의 집합이다. 도메인의 특성1. 각 속성이 가질 수 있도록 허용된 값들의 집합이다.2. 속성명과 도메인명이 반드시 동일할 ..
2과목 11. 다음 주어진 조건에 해당하는 쿼리문을 고르시오. 3 (보기) 특정 칼럼의 데이터 타입 조건으로 not null을 default로 지정한다. 1) alter table 테이블명 alter column 칼럼명 default not null 2) alter table 테이블명 add column 칼럼명 default not null 3) alter table 테이블명 modify(칼럼명 default not null) 4) alter table 테이블명 add_coonstrait column칼럼명 default not null [해설] 테이블에 존재하는 칼럼의 데이터 유형, 디폴트(default) 값, not null에 대한 제약조건을 변경하는 명령어는 alter문의 modify이다. alter..
3. 다음 보기 중 주식별자를 도출하기 위한 기준으로 알맞지 않은 것은? 4 1) 해당 업무에서 자주 이용되는 속성을 주식별자로 지정한다. 2) 명칭, 내역 등과 같은 이름으로 기술되는 것들은 가능하면 주식별자로 지정하지 않는다. 3) 복합으로 주식별자를 구성할 경우 너무 많은 속성이 포함되지 않도록 한다. 4) 지정된 주식별자의 값은 변경될 수도 있다. [해설] - 주식별자에 의해 엔터티 내에 모든 인스턴스가 유일하게 구분되어야 한다. - 주식별자를 구성하는 속성의 수는 유일성을 만족하는 최소의 수가 되어야 한다. - 지정된 주식별자의 값은 자주 변하지 않는 것이여야 한다. - 주식별자가 지정이 되면 반드시 값이 들어와야 한다. 난 4번으로 했다가 틀렸는데 주식별자는 변경 될 수도 있는거 아님? 자주만..
1과목 -4점 (2개) 2과목 -16점 (8개) 1과목 4. ERD에서 Realation(관계)에 표시되지 않는 것은 무엇인가? 4 1) 관계명 (Relationship Membership) 2) 관계 차수 (Relationship Degree/Cardinality) 3) 관계 선택사양 (Relationship Optionality) 4) 관계 분류 (Relationship Classifiacation) 풀이: 3번의 관계 선택 사양은 관계에서 항상 참여하는지 아니면 참여할 수도 있는지를 나타내는 방법이다. *(필수 관계, 선택 관계) 7. 아래와 같은 테이블이 있을 때 그 설명으로 부터 적절한 것은? 3 1) 4개의 테이블을 조인하기 위한 최소 조건은 3개이다. 2) 식별자 관계로만 연결될 경우 조인의..
분산 데이터베이스란? 데이터베이스 시스템 구축 시에 한 대의 물리적 시스템에 데이터베이스 관리 시스템을 처리하고 여러 명의 사용자가 데이터베이스 관리 시스템에 접속하여 데이터베이스를 사용하는 구조를 중앙 집중형 데이터베이스라고 한다. 그에 반해, 물리적으로 떨어진 데이터베이스에 네트워크로 연결하여 단일 데이터베이스 이미지를 보여주고 분산된 작업을 처리를 수행하는 데이터베이스를 분산 데이터베이스라고 한다. 분산 데이터 베이스를 사용하는 고객이 시스템이 분산되어 있는지 인식하지 못하면서, 자신만의 데이터베이스를 사용하는 것 처럼 사용할 수 있다. 이처럼 데이터베이스는 투명성을 제공해야 한다. 투명성은 분산 데이터베이스에서 중요한 요소이며 투명성의 종류에는 분할, 위치, 지역 사상, 중복, 장애 및 병행 투명..