일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- KT AIVLE
- 가나다영
- ML
- 시각화
- 지도학습
- 기계학습
- hadoop
- ETRI
- 웹크롤링
- 소셜네트워크분석
- cnn
- arima
- 에이블스쿨
- SQL
- 하둡
- 다변량분석
- SQLD
- ggplot2
- kt aivle school
- 한국전자통신연구원 인턴
- 시계열
- httr
- 머신러닝
- 딥러닝
- 서평
- matplot
- Ai
- 한국전자통신연구원
- 에이블러
- KT 에이블스쿨
- dx
- r
- 하계인턴
- 빅데이터분석기사
- kaggle
- 프로그래머스
- 에트리 인턴
- Eda
- python
- 빅분기
- Today
- Total
목록자격증/빅데이터분석기사 (4)
소품집
작업형 1 유형 score 값이 null 이 아닌 행만 가져와서 이상치에 해당하는 데이터 수 구하기 StandardScaler 적용해서 몇 이상인 데이터 수 구하기 df에서 가장 큰 상관관계를 갖는 컬럼명을 찾고, 그 컬럼의 평균 구하기 작업형 2 유형 회귀모델 구축하기 (평가지표: RMSE) 간단하게 GridSearch 해서 RF 돌렸음. 데이터 전처리에서는 결측치는 없었고 컬럼 더미화만 했음 작업형 3 유형 로지스틱 회귀 모형 구축 회귀 모형 구축 제 기억에는 위 문제 유형이었고, 1, 2 유형은 쉬웠는데 3이..ㅎ t-test나 chisquare anova 가 하나도 안나오고 모형 구축이어서 아쉬웠습니다.. help 쓰면서 푸는 내가 얼마나 킹받던지요... 붙은 것 같고 다음 8회차 응시하는 분들 ..
t-test 단일표본 t-검정 from scipy.stats import ttest_1samp # 귀무가설 : 평균키는 165이다 # 대립가설 : 평균키는 165가 아니다 # 1. 정규성을 만족하는가? # 2. ttest_1samp shapiros, p = shapiro(df) print(p) # 정규성을 갖지 않음! s, p, _ = ttest_1samp(df['height'], 165) print(p) # p-value는 0.0001로 대립가설을 채택한다. #따라서 평균키는 165가 아니다. 2. 대응(쌍체) 표본 t-검정 from scipy.stats import ttest_rel # 귀무가설: 혈류량의 변화가 있다 # 대립가설 : 혈류량의 변화가 없다 # 1. 정규성을 만족하는가? shapiro ..
https://www.datamanim.com/dataset/03_dataq/typetwo.html 작업 2유형 (파이썬) — DataManim 참고 모든 문제의 y_test값은 해당 url에서 y_test로 불러와 확인가능합니다. 실제로 제출을 위해 만든 데이터의 예측 점수를 확인해보세요 www.datamanim.com 작업형 2 유형은 분류/회귀 중 랜덤으로 나오고, 모듈 자동완성이 안되기 때문에..^^ 패키지까지 싸악 외워야한다! 간단한 데이터 전처리 및 모델 구축과 평가로 간단하게 진행하면 될 것 같다. (외워) 풀어보겠습니다~! 분류 (Classification) 1. 서비스 이탈 예측 데이터 import pandas as pd from sklearn.ensemble import RandomFo..
https://www.datamanim.com/dataset/99_pandas/pandasMain.html 판다스 연습 튜토리얼 — DataManim Question 43 df의 데이터 중 new_price값이 lst에 해당하는 경우의 데이터 프레임을 구하고 그 갯수를 출력하라 lst =[1.69, 2.39, 3.39, 4.45, 9.25, 10.98, 11.75, 16.98] www.datamanim.com 위 블로그는 빅분기 시험범위가 바뀐 시험 범위를 기준으로 기출 문제를 공유해주고 있어서 보고있는 블로그다. 작업형 1유형 데이터 전처리 문제를 풀어보겠습니다~! # 1. 롤 랭킹 데이터 1. 인기동영상 제작 횟수가 많은 채널 상위 10개명 (날짜 기준, 중복 포함) top_channel = df['..