일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- SQL
- 에이블러
- 시계열
- 하둡
- 소셜네트워크분석
- 머신러닝
- python
- 빅분기
- 웹크롤링
- 다변량분석
- 가나다영
- 시각화
- dx
- cnn
- Eda
- 빅데이터분석기사
- arima
- kt aivle school
- 기계학습
- 하계인턴
- httr
- 서평
- 딥러닝
- 에트리 인턴
- 한국전자통신연구원 인턴
- matplot
- 프로그래머스
- ETRI
- KT 에이블스쿨
- ggplot2
- Ai
- kaggle
- SQLD
- 지도학습
- ML
- 에이블스쿨
- r
- hadoop
- 한국전자통신연구원
- KT AIVLE
- Today
- Total
목록분류 전체보기 (221)
소품집
데이터 분석 프로세스 1. 비즈니스 이해 - 문제 정의 (따릉이 배치 장소를 추가하자) - 데이터 분석 방향, 목표 설정 (따릉이 수요와 공급이 맞는 장소에 배치를 늘린다) - 가설 수립 (따릉이 대여량은 따릉이 배치 시설과 관련이 있다) 2. 데이터 이해 - EDA & CDA - 데이터 통계량 확인 3. 데이터 전처리 - 결측치 확인 (대치, 삭제, 변환 등) - 가변수화 (범주 > 수치) - 스케일링 * 표준화, 정규화 - 데이터 분할 (train, validation) 4. 모델링 - 분류 > logistic, Naive bayes, DT, SVM, catboost, ensemble.. - 회귀 > liner, Gradient desent, ridge, lasso.. - 모델 학습 - 검증 및 평가..
앙상블 앙상블은 여러 분류기의 결과를 하나로 합치며 모델을 통합하는 것과 같고, 여러 개의 DT를 결합하며 하나의 모델을 사용했을 때 보다 더 높은 성능을 낼 수 있도록 한다. 앙상블 기법 중 많이 사용되는 학습 방법으로는 Voting, Bagging, Boosting, ECOC (Error-correcting output coding), Stacking 등이 있다. 1. 보팅 (voting) 일반적으로 보팅은 여러 가지 머신러닝 모델(여기에선 KNN, Logistic Regression, DT)을 같은 데이터 셋에 대하여 학습시킨 뒤, 예측한 결과를 투표하여 최종 결과로 선정하는 방식으로 진행된다. 보팅 방식에도 소프트 보팅과 하드 보팅으로 나뉜다. - 하드보팅 : 다수결 투표와 동일한 개념. 이 경우..
오늘은 지난주에 있었던 에이블 데이 후기를 알려드리려고 합니다. 에이블 데이는 쉬어가는 타임(?) 답게 추석 연휴 이전으로 잡아주셨어요! 에이블 데이 일주일 전인가 집으로 택배가 도착해서 보니까!! 에이블스쿨에서 보내주신 기프트 박스였어요. 저 평소에 블루보틀 진짜 좋아하거든요.. 저 텀블러도 원래 사용하던 건데! 완전 기분 좋았어요 ㅎ_ㅎ 저희 대전 1반은 이번 에이블 데이 때 오프라인으로 만났습니다! 둔산동에 있는 스터디 카페로 정해졌고, 저는 학교에 있어서 새벽에 KTX 타고 대전으로 갔어요! 너무 배고파서 좌석 앉자마자 바로 텀블러에 싸온 시리얼에 우유 말아 먹었습니닿..ㅋㅋㅋ 에이블 데이는 코테 수여식 / 코테 리뷰 / 특강 / 기자단 발표(제가 했어요 ㅎㅎ) / 반 세션으로 진행됐고 저는 반 ..
오늘은 제가 에이블스쿨에서 참여하고 있는 스터디를 소개해드리려고 합니다!! DX 5반에서 운영하는 스터디 두개 중 하나로, 종민님이 운영하는 스터디에 참여 중입니다. 저희는 매주 주말을 이용해 스터디를 하고 있고, 코테 문제 풀이와 데이터분석 그리고 의식의 흐름대로 흘러가는 대화도 많이 합니다!! ㅋㅋ 먼저 주중에는 구글문서에 스터디 참여가 가능한 요일에 표시를 해두고 가능한 스터디원끼리 모여 1~2시간 정도 세션 주제에 맞는 스터디를 진행합니다. 세션 1. 코테 스터디 1차 코딩마스터스 이벤트 기간에는 코드를 공유하며 다양한 접근 방법들을 공유했고, 못 푼 문제라면 팀원들에게 접근 법을 알려주는 등 기초~중급 문제를 풀어보며 스터디를 진행했습니다. 중급부터는 알고리즘을 공부하고 풀어야 하는 문제들이 많..
사이킷런(sklearn) - 파이썬에서 머신러닝 모델을 돌릴 때 유용하게 사용할 수 있는 라이브러리 - 여러 가지 머신러닝 모듈로 이루어져 있음. 모듈 불러오기 - 자주 사용되는 모듈을 불러오자 import numpy as np ## 기초 수학 연산 및 행렬계산 import pandas as pd ## 데이터프레임 사용 import seaborn as sns ## plot 그릴때 사용 import matplotlib.pyplot as plt ## plot 그릴때 사용 from sklearn import datasets ## iris와 같은 내장 데이터 사용 from sklearn.model_selection import train_test_split ## train, test 데이터 분할 from skl..
1. git init - repositpry 초기화 - 예를 들어 dy_test 빈 디렉터리를 생성해서, 파일 상세보기 명령어를 실행하면 git repositpry가 없음. - 현재 디렉토리를 기준으로 git init 명령어를 실행하면 git 저장소인 repository로 사용할 수 있음. 2. git status - 현재 상태 확인 - 수정된 파일이 있는지, 새로 생성된 파일이 있는지 확인 3. git add - git status에서 확인한 수정된 파일을 워크 디렉터리로 옮기고 싶을 때 명령어를 수행해준다. 3. git commit -m 'commit context' - '커밋시 생성되는 메시지' - 보통 파일을 설명하는 내용을 담는다. 4. git push origin master - branch ..
2주 전 1차 프로젝트에 이어서 2차 미니프로젝트 절차도 회고해보려 합니다. 코드 리뷰 형식으로 쓰고 싶지만.. 안 되는 것 같아서 회고 형식으로 써보겠습니다. 팀원은 1차 때와 동일하게 랜덤으로 정해서 공지해주셨고, 이번 프로젝트 기간은 총 4일로 진행됐습니다. DAY 1 첫날에는 지금까지 배운 내용을 정리하고 적용해보는 시간을 갖으며 서울시 버스 수요 분석을 위해 총 4개의 데이터를 기반으로 단변량, 이변량, 시각화, EDA 등 데이터 전처리부터 결과까지 훑어보는 시간을 가졌습니다. 개인 프로젝트로 진행됐고, 종료 후에는 셀프 테스트도 있었습니다. DAY 2 둘째 날은 KT 의사소통 방법인 NGT 방법론, 프로토타입 방법론 등을 배우며 팀플 과정에서 팀원들과 원활하게 소통하며 의견을 낼 수 있는 방법..
오늘은 에이블스쿨에서 첫 번째로 진행된 이벤트인 '게더타운 스터디룸 만들기' 참여 후기를 알려드리려고 합니다! 게더타운은 요즘 너무 핫.. 한 메타버스 가상공간인데, 실제로 재택근무하시는 분들은 팀원들과 작업 공간 or 사무실을 가상으로 꾸며 집중도를 높이는 취지로 생긴 플랫폼입니다. https://www.youtube.com/watch?v=gBxLyjLjB1k 제가 즐겨보는 카카오 개발자인 뚜벅초님 유튜브에서 먼저 본 기억이 있어서 반가웠던 기억이 있습니다. ㅎㅎ 사실 메타버스 공간이라고 해도 계기가 없으면 딱히 만들 이유가 없는데! 에이블스쿨에서 가상의 스터디룸 공간 만들기 이벤트를 진행해서 참여했습니다. 제가 에이블스쿨 인스타그램을 팔로우하고 있는데 제 게더타운이 수상작으로 올라와있더라고요! 공개해..
seaborn 시각화 라이브러리 옵션 정리 1. 히스토그램 + kde 중첩 plt.figure(figsize=(13,6)) plt.subplot(1,2,1) sns.histplot(data=titanic, x='Age', hue='Survived', bins=16,stat='density', kde=True, multiple='stack') plt.title('seaborn 히스토그램') plt.subplot(1,2,2) plt.hist(data=titanic, x='Age', bins=20, color='pink', edgecolor='black', alpha=0.7, density=True,) plt.xlabel('Age') plt.title('matplot 히스토그램') plt.grid() plt...
이번 주 3일간 진행됐던 미니 프로젝트 절차를 회고해보려 한다. 팀원은 반에서 랜덤으로 반을 조정해주셨고, 첫날과 둘 째날에는 마지막 프로젝트를 위한 빌드업(?)하는 시간을 갖는다. 강사님께서도 지금까지 한 내용을 되짚어주셨고, 개인 프로젝트와 팀 프로젝트, 그리고 셀프 테스트도 있었다. 둘째 날 팀플이 끝나고, 한 조원분께서 내일 최종 프로젝트를 위해서 단톡방을 만들자고 의견 주셨고 우리 팀원들은 모두 밤에 구글 미팅으로 다음날 최종 제출본을 위해 회의를 진행했다. 상사에게 데이터 분석한 내용을 보고하는 느낌이라고 해주셔서, 보고서도 작성하는 건가? 싶어 보고서 양식과 ppt 템플릿 초본을 만들어뒀다. 결론적으로는 보고서는 제출하는 게 아니었고, ppt에 모든 내용을 정리해서 제출하는 거였다. 그리고 ..