일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 지도학습
- 다변량분석
- KT AIVLE
- 하계인턴
- dx
- r
- arima
- httr
- ETRI
- SQLD
- 기계학습
- 에이블스쿨
- 서평
- 에이블러
- 소셜네트워크분석
- 한국전자통신연구원 인턴
- 한국전자통신연구원
- 시계열
- ggplot2
- KT 에이블스쿨
- SQL
- ML
- 웹크롤링
- 프로그래머스
- 시각화
- matplot
- 가나다영
- 머신러닝
- Eda
- kaggle
- 빅데이터분석기사
- 하둡
- 딥러닝
- Ai
- 빅분기
- 에트리 인턴
- python
- cnn
- kt aivle school
- hadoop
- Today
- Total
목록머신러닝 (12)
소품집
안녕하세요! 오늘은 KT 에이블스쿨 3차 미니프로젝트 회고를 해보려고 합니다. 이번 3차 미니프로젝트에서 가장 기억에 남았던 세션이었던 Kaggle competition에서 악성 코드 탐지 모델 개발을 주제로 진행됐는데요, 저는 이번 대회에서 13등을 했습니다!! 점심 먹기전엔 4등이었는데... 금세 밀려나는 게 재밌더라고요 오랜만에 전공지식 다 꺼내기 + 구글링 + 도메인 빠르게 확보.. 해서 10등에서 제발 내려가지 마라!! 했지만.. 어림도 없지 앞으로 치고 나오는 에이블러분들..ㅎㅎ... 한없이 겸손해지는 이번 대회였습니다. 앞으로도 경진대회 많이 했으면 좋겠어요!!ㅋㅋㅋ * 더 자세한 코드는 제 Github에 올려두었습니다. https://github.com/sodayeong/AIVLE-Scho..
👩🏻💻 데이터 소개 MIMIC-II 데이터 베이스란? 2001년~2008년 사이에 중환자실(ICU)에서 수집된 환자 생체 신호 데이터 환자차트데이터(chartevents) 파일에는 환자에 대한 모든 차트형 데이터를 포함 위 데이터에 있는 Primary Key를 기준으로 다른 데이터 베이스에 접근 할 수 있음 생체 신호 데이터에는 Heart Rate, Respiratory Rate, Blood Pressure, Boby Temperature 등의 정보가 포함되어 있음 기존 연구 자료에서도 위 환자 차트 데이터를 중점적으로 사용하며 활력 징후 코드를 추출 했으므로, 분석과 딥러닝 예측에 중요한 데이터로 판단함 👨🏻⚕️ 패혈증 분류를 위한 Feature 선정 그림1. 패혈증 진단에 필요한 생체신호 데이터 ..
0. Data domain https://github.com/mmalekzadeh/motion-sense GitHub - mmalekzadeh/motion-sense: MotionSense Dataset for Human Activity and Attribute Recognition ( time-series data generated MotionSense Dataset for Human Activity and Attribute Recognition ( time-series data generated by smartphone's sensors: accelerometer and gyroscope) (PMC Journal) (IoTDI'19) - GitHub - mmale... github.com A_Devi..
10장 (Ensembles) Summary 앙상블은 조화, 통합을 의미합니다. 어떤 데이터의 값을 예측한다고 할 때, 보통은 하나의 모델을 사용하는데요. 이와 달리 앙상블 모델은 여러개의 모델을 학습시켜 그 모델의 예측결과를 통합하여 예측값을 높이는데에 이용됩니다. 앙상블 학습은 여러 개의 DT(Decision Tree)를 결합하여 하나의 모델을 사용했을 때 보다 더 높은 성능을 내게 학습합니다. 앙상블의 기법 중 많이 사용되는 학습방법은 Bagging Boosting ECOC (Error-correcting output coding) Stacking 등이 있습니다. 부스팅 (Boosting) 부스팅은 가중치를 활용하여 약 분류기 → 강 분류기로 학습하는 과정이 진행됩니다. 처음 모델이 예측을 하면 그 ..
Small Dataset, Unbalanced Dataset Semi Supervised는 기계학습과 비지도학습의 중간 학습으로, 학습하기 전 사전에 모델에 분류를 위한 약간의 사전지식을 부여하게 됩니다. Transfer learning: 학습데이터가 부족한 분야의 모델 구축을 위해 데이터가 풍부한 분야에서 훈련된 모델을 재사용하게 됨 (ex: Pre-trained model의 파라메터로 초기화) Distant Supervision: a weakly labeled training set (training data is labeled automatically based on heuristics / rules) 약하게 라벨링 된 트레이닝 셋을 사용하게 됩니다. (훈련 데이터는 휴리스틱이나 규칙에 기반하여 자..
SVM: Motivation (+)와 (-)의 class를 구분짓기 위해서는 여러 방법을 생각할 수 있습니다. 그러면 어떻게 나눠야 잘 나눴다고 할 수 있을까요? 아마 제일 잘 나눴다고 볼 수 있는 형태는 이런 모습일 것 입니다. 나누는 목적: 데이터 클래스 (class, label) 분류 그렇다면, '잘 나눈다'는 것 == 클래스 사이의 딱 중간이 아닐까? 딱 중간 이라면, 서로 다른 클래스 간에 **'거리가 최대'**가 되게 하는 것 정리해보면, SVM에서 찾고자 하는 decision boundary 는 다른 클래스에 속한 데이터들 간에 '거리가 최대'가 되게 하는 boundary라 볼 수 있게 되고,이 때 boundary를 **'Max margin'**이라 합니다. 이 boundary는 두 개의 경..
2020/05/11 - [Data mining] - Artificial Neural Network (인공신경망) Artificial Neural Network (인공신경망) Neural Network Motivated by studies of the brain (사람의 뇌를 학습한 모습!) A network of "artificial neurons" that learns a function Doesn't have clear decision rules like decision trees, but highl.. sodayeong.tistory.com 이전 내용과 이어집니다. ANN 학습 : Back-propagation (역전파 알고리즘) Back-propagation 전체에 대한 편미분을 곧바로 구하지 않..
Neural Network Motivated by studies of the brain (사람의 뇌를 학습한 모습!) A network of "artificial neurons" that learns a function Doesn't have clear decision rules like decision trees, but highly successful in many different application (e.g. face detection) → D.T와 같은 완전한 결정(classification)은 하지 못하지만, 여러 응용 분야에서 높은 성공률을 보여줌 Artificial Neural Networks ANN의 특징 한 쪽 방향으로 흐름 (feed forward) 보통 1개 이상의 hidden l..
Linear Regression (선형회귀) 수식 미분으로 한 번에 구하는 방법 sum of squared error를 최소화 하기 위해 미분하여 얻은 최소화 된 식은 y = Xb (Xt)y = (Xt)Xb[(Xt)X]^(-1)(Xt)y = [(Xt)X]^(-1)(Xt)Xb [(Xt)X]^(-1)(Xt)y = b 즉, 주어진 데이터 (x,y)만 있으면 위 수식으로 한 번에 파라미터(beta값 ==기울기) 를 계산할 수 있음 계산이 끝나면, 그 파라메터로 테스트 데이터에 적용하여 예측값 ^y 생성이 가능함 Iterative(반복 수행) 방법으로 학습하는 방법 데이터 (각각 (x,y)값으로 취급) (2,5), (3,7), (4,9), (5,11) 선형 모델 가정하기: ax+by+c=0 (파라메터: a,b,c..
Machine Learning? 원초적인 이야기부터 하자면, 아이는 어떻게 말할 수 있게 된 걸까요? 주변에서 '반복'하여 들려주는 다양한 말을 '학습'하게 되는데요. 즉, 학습과 경험을 통해 쌓은 데이터로 말이죠. 기계학습은 학습법에 따라 네 가지로 분류할 수 있습니다. Different kinds of learning Supervised Learning (지도학습) 모델 학습을 위해 '정답'이 주어진 데이터가 필요 정답이 주어진 데이터를 '분류'하는 작업에 이용 → Classification 대표적인 분류모델 Decision Trees Neural networks support vector machines Unsupervised Learning (비지도학습) 모델 학습에 '정답' 필요없음 데이터만 있..