일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- kt aivle school
- ggplot2
- 다변량분석
- 한국전자통신연구원
- Eda
- 하계인턴
- KT 에이블스쿨
- 가나다영
- 시계열
- 서평
- SQLD
- 기계학습
- Ai
- SQL
- hadoop
- 빅분기
- kaggle
- 에트리 인턴
- ML
- 한국전자통신연구원 인턴
- 지도학습
- 웹크롤링
- 머신러닝
- 프로그래머스
- r
- python
- 소셜네트워크분석
- httr
- 에이블러
- cnn
- dx
- 딥러닝
- KT AIVLE
- 빅데이터분석기사
- 에이블스쿨
- arima
- matplot
- 하둡
- ETRI
- 시각화
- Today
- Total
목록AI (104)
소품집
안녕하세요! 오늘은 KT 에이블스쿨 3차 미니프로젝트 회고를 해보려고 합니다. 이번 3차 미니프로젝트에서 가장 기억에 남았던 세션이었던 Kaggle competition에서 악성 코드 탐지 모델 개발을 주제로 진행됐는데요, 저는 이번 대회에서 13등을 했습니다!! 점심 먹기전엔 4등이었는데... 금세 밀려나는 게 재밌더라고요 오랜만에 전공지식 다 꺼내기 + 구글링 + 도메인 빠르게 확보.. 해서 10등에서 제발 내려가지 마라!! 했지만.. 어림도 없지 앞으로 치고 나오는 에이블러분들..ㅎㅎ... 한없이 겸손해지는 이번 대회였습니다. 앞으로도 경진대회 많이 했으면 좋겠어요!!ㅋㅋㅋ * 더 자세한 코드는 제 Github에 올려두었습니다. https://github.com/sodayeong/AIVLE-Scho..
# GPU 잡기 import tensorflow as tf tf.__version__ from tensorflow.python.client import device_lib device_lib.list_local_devices() tf.test.is_gpu_available() True로 나오면 GPU 할당 확인 !! https://webnautes.tistory.com/1672 XGBoost Warning 해결 방법 다음 두가지 XGBoost Warning을 해결하는 방법을 다룹니다. 2022. 4. 14 최초작성 WARNING: C:/Users/Administrator/workspace/xgboost-win64_release_1.3.0/src/learner.cc:1061: Starting in XGBo..
지도 교수: 문지훈 교수님 팀원: 김의년, 소다영, 한태규 결과물: 한국통신학회 추계 학술대회 논문 2편 https://github.com/sodayeong/Solar_radiation_prediction_model-1 GitHub - sodayeong/Solar_radiation_prediction_model-1: 전이학습 모델 논문 코드 전이학습 모델 논문 코드. Contribute to sodayeong/Solar_radiation_prediction_model-1 development by creating an account on GitHub. github.com
KT 지니랩에서 주최한 데브옵스 경진대회에서 과제 2를 주제로 참여했습니다! 감사하게도 스터디에서 연진님과 종민님이 저를 캐스팅(?) 해주셔서 감사한 마음으로 참여했어요. (❁´◡`❁) 두 분은 지난 미니프로젝트와 매주 진행되는 스터디에서도 봬서 학과 친구들 같이 빨리 스며들 수 있었습니다.ㅎㅎ 과제 2는 데이터 파기 서약서를 제출하고 구글 드라이브 공유 문서로 다운로드할 수 있었습니다. 분석에 필요한 도메인 자료와 주의점 등 공유된 파일이 많아서 읽어보는데 시간이 좀 걸렸습니다. 근데... 파일이 너무 커서 전처리가 안 돌아가는 거예요... 지금까지 한 공모전 중에 용량이 제일 컸어요.... 그래서 주말에 연구실 석사 오빠 자리를 빌려서 새벽에 코드 돌려놓고 아침에 확인하고 최적화하는 식으로 진행했습니..
정리중
https://sodayeong.tistory.com/142?category=977648 [Deep Learning] CNN 입출력, 파라미터 계산 다음 조건과 같은 이미지를 학습하는 CNN의 각 레이어별 입력 데이터와 출력 데이터의 Shape을 계산해 보고 네트워크가 학습시키는 파라미터의 개수를 계산해 보겠습니다. 입력 데이터 Shape: (39, 31 sodayeong.tistory.com - 코랩 환경에서 이미지 분류 데이터 셋으로 유명한 MNIST 데이터로 CNN 모델을 실습했다. - 강의 진도 상 오늘은 실습만 하고, 추후 이론 설명을 해주신다고 하셨다. - 지난번에 기록한 딥러닝 CNN 입출력, 파라미터 계산을 공부하고 내일 수업 듣자.
sequential model 기본 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import train_test_split from sklearn.metrics import * from sklearn.preprocessing import StandardScaler, MinMaxScaler # DL - keras from keras.models import Sequential # 모델 레이어를 선형으로 연결, 인스턴스 자동으로 넘겨줌 from keras.layers import Dense # hidden layer 쌓기 from ten..
👩🏻💻 데이터 소개 MIMIC-II 데이터 베이스란? 2001년~2008년 사이에 중환자실(ICU)에서 수집된 환자 생체 신호 데이터 환자차트데이터(chartevents) 파일에는 환자에 대한 모든 차트형 데이터를 포함 위 데이터에 있는 Primary Key를 기준으로 다른 데이터 베이스에 접근 할 수 있음 생체 신호 데이터에는 Heart Rate, Respiratory Rate, Blood Pressure, Boby Temperature 등의 정보가 포함되어 있음 기존 연구 자료에서도 위 환자 차트 데이터를 중점적으로 사용하며 활력 징후 코드를 추출 했으므로, 분석과 딥러닝 예측에 중요한 데이터로 판단함 👨🏻⚕️ 패혈증 분류를 위한 Feature 선정 그림1. 패혈증 진단에 필요한 생체신호 데이터 ..
MIMIC -III 중환자실 데이터 DEMO 1. MIMIC-III 기본 정보 - MIMIC-III는 Medical Information Mart for Intensive Care의 약자로, Beth Israel Deaconess Center 중환자실에서 발생한 데이터를 MIT에서 정리하고 개발한 Open Source 데이터다. - 2001년부터 2012년까지 약 4만 명(성인: 53,432명 + 영아: 8,1000명) 이상의 비식별 보건 의료 데이터를 포함하고 있다. - 포함된 비식별 데이터는 기초 인구 통계학, 활력 징후, 실험실 결과, 처방전, 간병인의 메모, 이미지 기록, 사망 여부 등의 데이터를 포함하고 있다. 2. 데이터 분석 목적 입원 초기 변수와 생체 신호를 바탕으로 패혈증 환자를 찾는다...
데이터 분석 프로세스 1. 비즈니스 이해 - 문제 정의 (따릉이 배치 장소를 추가하자) - 데이터 분석 방향, 목표 설정 (따릉이 수요와 공급이 맞는 장소에 배치를 늘린다) - 가설 수립 (따릉이 대여량은 따릉이 배치 시설과 관련이 있다) 2. 데이터 이해 - EDA & CDA - 데이터 통계량 확인 3. 데이터 전처리 - 결측치 확인 (대치, 삭제, 변환 등) - 가변수화 (범주 > 수치) - 스케일링 * 표준화, 정규화 - 데이터 분할 (train, validation) 4. 모델링 - 분류 > logistic, Naive bayes, DT, SVM, catboost, ensemble.. - 회귀 > liner, Gradient desent, ridge, lasso.. - 모델 학습 - 검증 및 평가..