일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- dx
- hadoop
- 시계열
- ggplot2
- 빅분기
- KT AIVLE
- kt aivle school
- 에이블스쿨
- ETRI
- 웹크롤링
- 에트리 인턴
- 딥러닝
- 한국전자통신연구원
- 머신러닝
- cnn
- 빅데이터분석기사
- 시각화
- KT 에이블스쿨
- kaggle
- 하계인턴
- matplot
- Ai
- 한국전자통신연구원 인턴
- httr
- 프로그래머스
- SQL
- 가나다영
- Eda
- arima
- 기계학습
- 지도학습
- 다변량분석
- 소셜네트워크분석
- r
- 하둡
- SQLD
- 서평
- python
- ML
- 에이블러
- Today
- Total
목록AI/KT 에이블스쿨 (28)
소품집
안녕하세요! 오늘은 KT 에이블스쿨 3차 미니프로젝트 회고를 해보려고 합니다. 이번 3차 미니프로젝트에서 가장 기억에 남았던 세션이었던 Kaggle competition에서 악성 코드 탐지 모델 개발을 주제로 진행됐는데요, 저는 이번 대회에서 13등을 했습니다!! 점심 먹기전엔 4등이었는데... 금세 밀려나는 게 재밌더라고요 오랜만에 전공지식 다 꺼내기 + 구글링 + 도메인 빠르게 확보.. 해서 10등에서 제발 내려가지 마라!! 했지만.. 어림도 없지 앞으로 치고 나오는 에이블러분들..ㅎㅎ... 한없이 겸손해지는 이번 대회였습니다. 앞으로도 경진대회 많이 했으면 좋겠어요!!ㅋㅋㅋ * 더 자세한 코드는 제 Github에 올려두었습니다. https://github.com/sodayeong/AIVLE-Scho..
KT 지니랩에서 주최한 데브옵스 경진대회에서 과제 2를 주제로 참여했습니다! 감사하게도 스터디에서 연진님과 종민님이 저를 캐스팅(?) 해주셔서 감사한 마음으로 참여했어요. (❁´◡`❁) 두 분은 지난 미니프로젝트와 매주 진행되는 스터디에서도 봬서 학과 친구들 같이 빨리 스며들 수 있었습니다.ㅎㅎ 과제 2는 데이터 파기 서약서를 제출하고 구글 드라이브 공유 문서로 다운로드할 수 있었습니다. 분석에 필요한 도메인 자료와 주의점 등 공유된 파일이 많아서 읽어보는데 시간이 좀 걸렸습니다. 근데... 파일이 너무 커서 전처리가 안 돌아가는 거예요... 지금까지 한 공모전 중에 용량이 제일 컸어요.... 그래서 주말에 연구실 석사 오빠 자리를 빌려서 새벽에 코드 돌려놓고 아침에 확인하고 최적화하는 식으로 진행했습니..
정리중
https://sodayeong.tistory.com/142?category=977648 [Deep Learning] CNN 입출력, 파라미터 계산 다음 조건과 같은 이미지를 학습하는 CNN의 각 레이어별 입력 데이터와 출력 데이터의 Shape을 계산해 보고 네트워크가 학습시키는 파라미터의 개수를 계산해 보겠습니다. 입력 데이터 Shape: (39, 31 sodayeong.tistory.com - 코랩 환경에서 이미지 분류 데이터 셋으로 유명한 MNIST 데이터로 CNN 모델을 실습했다. - 강의 진도 상 오늘은 실습만 하고, 추후 이론 설명을 해주신다고 하셨다. - 지난번에 기록한 딥러닝 CNN 입출력, 파라미터 계산을 공부하고 내일 수업 듣자.
sequential model 기본 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import train_test_split from sklearn.metrics import * from sklearn.preprocessing import StandardScaler, MinMaxScaler # DL - keras from keras.models import Sequential # 모델 레이어를 선형으로 연결, 인스턴스 자동으로 넘겨줌 from keras.layers import Dense # hidden layer 쌓기 from ten..
데이터 분석 프로세스 1. 비즈니스 이해 - 문제 정의 (따릉이 배치 장소를 추가하자) - 데이터 분석 방향, 목표 설정 (따릉이 수요와 공급이 맞는 장소에 배치를 늘린다) - 가설 수립 (따릉이 대여량은 따릉이 배치 시설과 관련이 있다) 2. 데이터 이해 - EDA & CDA - 데이터 통계량 확인 3. 데이터 전처리 - 결측치 확인 (대치, 삭제, 변환 등) - 가변수화 (범주 > 수치) - 스케일링 * 표준화, 정규화 - 데이터 분할 (train, validation) 4. 모델링 - 분류 > logistic, Naive bayes, DT, SVM, catboost, ensemble.. - 회귀 > liner, Gradient desent, ridge, lasso.. - 모델 학습 - 검증 및 평가..
앙상블 앙상블은 여러 분류기의 결과를 하나로 합치며 모델을 통합하는 것과 같고, 여러 개의 DT를 결합하며 하나의 모델을 사용했을 때 보다 더 높은 성능을 낼 수 있도록 한다. 앙상블 기법 중 많이 사용되는 학습 방법으로는 Voting, Bagging, Boosting, ECOC (Error-correcting output coding), Stacking 등이 있다. 1. 보팅 (voting) 일반적으로 보팅은 여러 가지 머신러닝 모델(여기에선 KNN, Logistic Regression, DT)을 같은 데이터 셋에 대하여 학습시킨 뒤, 예측한 결과를 투표하여 최종 결과로 선정하는 방식으로 진행된다. 보팅 방식에도 소프트 보팅과 하드 보팅으로 나뉜다. - 하드보팅 : 다수결 투표와 동일한 개념. 이 경우..
오늘은 지난주에 있었던 에이블 데이 후기를 알려드리려고 합니다. 에이블 데이는 쉬어가는 타임(?) 답게 추석 연휴 이전으로 잡아주셨어요! 에이블 데이 일주일 전인가 집으로 택배가 도착해서 보니까!! 에이블스쿨에서 보내주신 기프트 박스였어요. 저 평소에 블루보틀 진짜 좋아하거든요.. 저 텀블러도 원래 사용하던 건데! 완전 기분 좋았어요 ㅎ_ㅎ 저희 대전 1반은 이번 에이블 데이 때 오프라인으로 만났습니다! 둔산동에 있는 스터디 카페로 정해졌고, 저는 학교에 있어서 새벽에 KTX 타고 대전으로 갔어요! 너무 배고파서 좌석 앉자마자 바로 텀블러에 싸온 시리얼에 우유 말아 먹었습니닿..ㅋㅋㅋ 에이블 데이는 코테 수여식 / 코테 리뷰 / 특강 / 기자단 발표(제가 했어요 ㅎㅎ) / 반 세션으로 진행됐고 저는 반 ..
오늘은 제가 에이블스쿨에서 참여하고 있는 스터디를 소개해드리려고 합니다!! DX 5반에서 운영하는 스터디 두개 중 하나로, 종민님이 운영하는 스터디에 참여 중입니다. 저희는 매주 주말을 이용해 스터디를 하고 있고, 코테 문제 풀이와 데이터분석 그리고 의식의 흐름대로 흘러가는 대화도 많이 합니다!! ㅋㅋ 먼저 주중에는 구글문서에 스터디 참여가 가능한 요일에 표시를 해두고 가능한 스터디원끼리 모여 1~2시간 정도 세션 주제에 맞는 스터디를 진행합니다. 세션 1. 코테 스터디 1차 코딩마스터스 이벤트 기간에는 코드를 공유하며 다양한 접근 방법들을 공유했고, 못 푼 문제라면 팀원들에게 접근 법을 알려주는 등 기초~중급 문제를 풀어보며 스터디를 진행했습니다. 중급부터는 알고리즘을 공부하고 풀어야 하는 문제들이 많..
사이킷런(sklearn) - 파이썬에서 머신러닝 모델을 돌릴 때 유용하게 사용할 수 있는 라이브러리 - 여러 가지 머신러닝 모듈로 이루어져 있음. 모듈 불러오기 - 자주 사용되는 모듈을 불러오자 import numpy as np ## 기초 수학 연산 및 행렬계산 import pandas as pd ## 데이터프레임 사용 import seaborn as sns ## plot 그릴때 사용 import matplotlib.pyplot as plt ## plot 그릴때 사용 from sklearn import datasets ## iris와 같은 내장 데이터 사용 from sklearn.model_selection import train_test_split ## train, test 데이터 분할 from skl..