일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- SQLD
- r
- 하계인턴
- 서평
- SQL
- KT AIVLE
- 한국전자통신연구원
- KT 에이블스쿨
- dx
- 프로그래머스
- 에이블스쿨
- 한국전자통신연구원 인턴
- 소셜네트워크분석
- 에트리 인턴
- ML
- 다변량분석
- ETRI
- 가나다영
- hadoop
- 기계학습
- ggplot2
- arima
- kt aivle school
- 머신러닝
- 지도학습
- 빅데이터분석기사
- 에이블러
- matplot
- python
- cnn
- 빅분기
- httr
- Eda
- 웹크롤링
- 딥러닝
- 시각화
- kaggle
- Ai
- 하둡
- 시계열
- Today
- Total
목록Eda (3)
소품집
정말,,, 역대급으로 오래 걸리고 있는 kaggle이다. 잔 기술 많이 배워서 꼼꼼하게 하고 있습니다 😎 getwd() setwd('/Users/dayeong/Desktop/reserch/data') # Restaurant Visitor Forecasting EDA with R # https://www.kaggle.com/maestroyi/restaurant-visitor-forecasting-eda-with-r # general visualisation library(ggplot2) library(scales) library(grid) library(gridExtra) library(RColorBrewer) library(corrplot) # general data manipulation library..
dplyr 패키지 연습 겸 EDA 연습 겸 getwd() setwd('/Users/dayeong/Desktop/reserch/data') library(dplyr) library(ggplot2) # 0. Data load 및 이전 시험 진행과정 athlete % arrange(desc(mean_height)) head(survey) # Step2. 위의 나온 결과물을 활용해 해당하는 team만 뽑고, # Team별로 가장 키가 큰 사람과 가장 작은 사람의 키, 두 키의 차이를 출력 team % group_by(Team) %>% summarise(max_hei = max(Height), min_hei = min(Height), dif = max(Height)- min(Height)) head(survey2..
setwd('/Users/dayeong/Desktop/reserch/data') # Dataloading dt_loan % mutate(buy_n = n()) %>% filter(buy_n>=600) # 중복 제거 dt 이 Age 고객들을 분석해보자 Age_25 % filter( Age == "26-35" ) Age_25 % mutate(ratio = n/sum(n), location = ifelse(ratio > min(ratio) , min(ratio) + ratio/2 , ratio/2 ) ) plot1 % ggplot(aes(x=factor(1), y = ratio, fill = Marital_Status)) + geom_bar(stat="identity") + geom_text(aes(x= fa..