일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- python
- 다변량분석
- 에이블러
- 한국전자통신연구원
- httr
- r
- 한국전자통신연구원 인턴
- 소셜네트워크분석
- ggplot2
- SQLD
- kt aivle school
- 에이블스쿨
- cnn
- 하계인턴
- 빅분기
- SQL
- 시각화
- kaggle
- 서평
- hadoop
- 프로그래머스
- 에트리 인턴
- KT 에이블스쿨
- 가나다영
- 웹크롤링
- arima
- 머신러닝
- dx
- 시계열
- 하둡
- ETRI
- matplot
- 기계학습
- 딥러닝
- ML
- 지도학습
- Eda
- Ai
- 빅데이터분석기사
- KT AIVLE
- Today
- Total
목록KT 에이블스쿨 (21)
소품집
안녕하세요! 오늘은 KT 에이블스쿨 3차 미니프로젝트 회고를 해보려고 합니다. 이번 3차 미니프로젝트에서 가장 기억에 남았던 세션이었던 Kaggle competition에서 악성 코드 탐지 모델 개발을 주제로 진행됐는데요, 저는 이번 대회에서 13등을 했습니다!! 점심 먹기전엔 4등이었는데... 금세 밀려나는 게 재밌더라고요 오랜만에 전공지식 다 꺼내기 + 구글링 + 도메인 빠르게 확보.. 해서 10등에서 제발 내려가지 마라!! 했지만.. 어림도 없지 앞으로 치고 나오는 에이블러분들..ㅎㅎ... 한없이 겸손해지는 이번 대회였습니다. 앞으로도 경진대회 많이 했으면 좋겠어요!!ㅋㅋㅋ * 더 자세한 코드는 제 Github에 올려두었습니다. https://github.com/sodayeong/AIVLE-Scho..
sequential model 기본 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import train_test_split from sklearn.metrics import * from sklearn.preprocessing import StandardScaler, MinMaxScaler # DL - keras from keras.models import Sequential # 모델 레이어를 선형으로 연결, 인스턴스 자동으로 넘겨줌 from keras.layers import Dense # hidden layer 쌓기 from ten..
데이터 분석 프로세스 1. 비즈니스 이해 - 문제 정의 (따릉이 배치 장소를 추가하자) - 데이터 분석 방향, 목표 설정 (따릉이 수요와 공급이 맞는 장소에 배치를 늘린다) - 가설 수립 (따릉이 대여량은 따릉이 배치 시설과 관련이 있다) 2. 데이터 이해 - EDA & CDA - 데이터 통계량 확인 3. 데이터 전처리 - 결측치 확인 (대치, 삭제, 변환 등) - 가변수화 (범주 > 수치) - 스케일링 * 표준화, 정규화 - 데이터 분할 (train, validation) 4. 모델링 - 분류 > logistic, Naive bayes, DT, SVM, catboost, ensemble.. - 회귀 > liner, Gradient desent, ridge, lasso.. - 모델 학습 - 검증 및 평가..
앙상블 앙상블은 여러 분류기의 결과를 하나로 합치며 모델을 통합하는 것과 같고, 여러 개의 DT를 결합하며 하나의 모델을 사용했을 때 보다 더 높은 성능을 낼 수 있도록 한다. 앙상블 기법 중 많이 사용되는 학습 방법으로는 Voting, Bagging, Boosting, ECOC (Error-correcting output coding), Stacking 등이 있다. 1. 보팅 (voting) 일반적으로 보팅은 여러 가지 머신러닝 모델(여기에선 KNN, Logistic Regression, DT)을 같은 데이터 셋에 대하여 학습시킨 뒤, 예측한 결과를 투표하여 최종 결과로 선정하는 방식으로 진행된다. 보팅 방식에도 소프트 보팅과 하드 보팅으로 나뉜다. - 하드보팅 : 다수결 투표와 동일한 개념. 이 경우..
오늘은 지난주에 있었던 에이블 데이 후기를 알려드리려고 합니다. 에이블 데이는 쉬어가는 타임(?) 답게 추석 연휴 이전으로 잡아주셨어요! 에이블 데이 일주일 전인가 집으로 택배가 도착해서 보니까!! 에이블스쿨에서 보내주신 기프트 박스였어요. 저 평소에 블루보틀 진짜 좋아하거든요.. 저 텀블러도 원래 사용하던 건데! 완전 기분 좋았어요 ㅎ_ㅎ 저희 대전 1반은 이번 에이블 데이 때 오프라인으로 만났습니다! 둔산동에 있는 스터디 카페로 정해졌고, 저는 학교에 있어서 새벽에 KTX 타고 대전으로 갔어요! 너무 배고파서 좌석 앉자마자 바로 텀블러에 싸온 시리얼에 우유 말아 먹었습니닿..ㅋㅋㅋ 에이블 데이는 코테 수여식 / 코테 리뷰 / 특강 / 기자단 발표(제가 했어요 ㅎㅎ) / 반 세션으로 진행됐고 저는 반 ..
사이킷런(sklearn) - 파이썬에서 머신러닝 모델을 돌릴 때 유용하게 사용할 수 있는 라이브러리 - 여러 가지 머신러닝 모듈로 이루어져 있음. 모듈 불러오기 - 자주 사용되는 모듈을 불러오자 import numpy as np ## 기초 수학 연산 및 행렬계산 import pandas as pd ## 데이터프레임 사용 import seaborn as sns ## plot 그릴때 사용 import matplotlib.pyplot as plt ## plot 그릴때 사용 from sklearn import datasets ## iris와 같은 내장 데이터 사용 from sklearn.model_selection import train_test_split ## train, test 데이터 분할 from skl..
1. git init - repositpry 초기화 - 예를 들어 dy_test 빈 디렉터리를 생성해서, 파일 상세보기 명령어를 실행하면 git repositpry가 없음. - 현재 디렉토리를 기준으로 git init 명령어를 실행하면 git 저장소인 repository로 사용할 수 있음. 2. git status - 현재 상태 확인 - 수정된 파일이 있는지, 새로 생성된 파일이 있는지 확인 3. git add - git status에서 확인한 수정된 파일을 워크 디렉터리로 옮기고 싶을 때 명령어를 수행해준다. 3. git commit -m 'commit context' - '커밋시 생성되는 메시지' - 보통 파일을 설명하는 내용을 담는다. 4. git push origin master - branch ..
2주 전 1차 프로젝트에 이어서 2차 미니프로젝트 절차도 회고해보려 합니다. 코드 리뷰 형식으로 쓰고 싶지만.. 안 되는 것 같아서 회고 형식으로 써보겠습니다. 팀원은 1차 때와 동일하게 랜덤으로 정해서 공지해주셨고, 이번 프로젝트 기간은 총 4일로 진행됐습니다. DAY 1 첫날에는 지금까지 배운 내용을 정리하고 적용해보는 시간을 갖으며 서울시 버스 수요 분석을 위해 총 4개의 데이터를 기반으로 단변량, 이변량, 시각화, EDA 등 데이터 전처리부터 결과까지 훑어보는 시간을 가졌습니다. 개인 프로젝트로 진행됐고, 종료 후에는 셀프 테스트도 있었습니다. DAY 2 둘째 날은 KT 의사소통 방법인 NGT 방법론, 프로토타입 방법론 등을 배우며 팀플 과정에서 팀원들과 원활하게 소통하며 의견을 낼 수 있는 방법..
오늘은 에이블스쿨에서 첫 번째로 진행된 이벤트인 '게더타운 스터디룸 만들기' 참여 후기를 알려드리려고 합니다! 게더타운은 요즘 너무 핫.. 한 메타버스 가상공간인데, 실제로 재택근무하시는 분들은 팀원들과 작업 공간 or 사무실을 가상으로 꾸며 집중도를 높이는 취지로 생긴 플랫폼입니다. https://www.youtube.com/watch?v=gBxLyjLjB1k 제가 즐겨보는 카카오 개발자인 뚜벅초님 유튜브에서 먼저 본 기억이 있어서 반가웠던 기억이 있습니다. ㅎㅎ 사실 메타버스 공간이라고 해도 계기가 없으면 딱히 만들 이유가 없는데! 에이블스쿨에서 가상의 스터디룸 공간 만들기 이벤트를 진행해서 참여했습니다. 제가 에이블스쿨 인스타그램을 팔로우하고 있는데 제 게더타운이 수상작으로 올라와있더라고요! 공개해..
seaborn 시각화 라이브러리 옵션 정리 1. 히스토그램 + kde 중첩 plt.figure(figsize=(13,6)) plt.subplot(1,2,1) sns.histplot(data=titanic, x='Age', hue='Survived', bins=16,stat='density', kde=True, multiple='stack') plt.title('seaborn 히스토그램') plt.subplot(1,2,2) plt.hist(data=titanic, x='Age', bins=20, color='pink', edgecolor='black', alpha=0.7, density=True,) plt.xlabel('Age') plt.title('matplot 히스토그램') plt.grid() plt...