일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- SQLD
- 지도학습
- dx
- 한국전자통신연구원
- 프로그래머스
- 시계열
- Ai
- SQL
- 다변량분석
- 에이블스쿨
- 시각화
- Eda
- 웹크롤링
- 가나다영
- ML
- 하계인턴
- r
- 딥러닝
- 기계학습
- httr
- ggplot2
- hadoop
- python
- cnn
- 서평
- ETRI
- matplot
- 하둡
- 한국전자통신연구원 인턴
- 에이블러
- kt aivle school
- 에트리 인턴
- kaggle
- 소셜네트워크분석
- 빅데이터분석기사
- KT 에이블스쿨
- 머신러닝
- KT AIVLE
- 빅분기
- arima
- Today
- Total
목록feature selection (2)
소품집
Basic 보루타 알고리즘은 랜덤포레스트를 기반으로 변수를 선택하는 래퍼 방법(Wrapper Method)으로 기본적인 아이디어는 기존 변수를 복원 추출해서 만든 변수(shadow)보다 모형 생성에 영향을 주지 못했다고 하면 이는 중요도가 떨어지는 변수로 인식해 제거하는 방법. Feature selection method Filter Method : 모델링 기법에 의존하지 않고 데이터에 대한 통상적인 특성 예를 들면 상호 정보량, 상관계수로부터 변수 순위를 정하고 가장 높은 순위의 변수들을 선택하는 방법 Wrapper Method : 변수의 일부만을 사용해 모델링을 수행하고 그 결과를 확인하는 작업을 반복하여 변수를 선택하는 방법으로, 예측 정확도 측면에서 가장 좋은 성능을 보이는 부분 집합을 뽑아내는 ..
정말,,, 역대급으로 오래 걸리고 있는 kaggle이다. 잔 기술 많이 배워서 꼼꼼하게 하고 있습니다 😎 getwd() setwd('/Users/dayeong/Desktop/reserch/data') # Restaurant Visitor Forecasting EDA with R # https://www.kaggle.com/maestroyi/restaurant-visitor-forecasting-eda-with-r # general visualisation library(ggplot2) library(scales) library(grid) library(gridExtra) library(RColorBrewer) library(corrplot) # general data manipulation library..