일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- ML
- dx
- cnn
- r
- Ai
- 하계인턴
- 서평
- 에트리 인턴
- 다변량분석
- kaggle
- SQL
- KT AIVLE
- 빅데이터분석기사
- 소셜네트워크분석
- ETRI
- SQLD
- python
- 머신러닝
- hadoop
- 하둡
- 에이블스쿨
- 빅분기
- 지도학습
- arima
- 한국전자통신연구원
- 한국전자통신연구원 인턴
- 웹크롤링
- kt aivle school
- 프로그래머스
- 에이블러
- 시각화
- httr
- 가나다영
- 기계학습
- matplot
- KT 에이블스쿨
- 시계열
- Eda
- 딥러닝
- ggplot2
- Today
- Total
목록분류 전체보기 (221)
소품집
곧 석사 막 학기 들어가고 이제 하반기 공채도 들어간다여름 방학 때 좋은 기회로 미네소타 대학교에서 공부했는데, 많이 긴장하고 힘들게 공부하면서 지냈어서 그런지 아직은 좋았던 게 잘 생각나지 않는다 ㅠㅋㅋ 상반기와는 다르게 내 독기도 많이 빠진 것 같고 자신감도 많이 떨어졌는데,그래도 석사 생활에서 할 수 있는 연구 스펙은 최대로 끌었다고 생각한다 SCIE 1 저자 2개, 공저자 다수 그리고 대한전기 KCI도 한 번에 최종본 내라고 할 만큼 내 연구에 자신 있다 불확실성에서는 당연하게도 안정감을 찾을 수 없다차분하게 내 루틴 찾으면서 규칙적인 생활에서 오는 안정감을 찾으려고 노력하려고 하자 요건 미네소타에서의 생활에 관한거고, 공부 한 내용도 티스토리에 차근히 올려보려고 한다 https://blog..
Gaussian Process Regression (GPR)Gaussian Process (GP)는 무엇인가?전통적으로 Classification이나 Regression과 같은 Supervised Learning은 Parametric 모델들을 통해 풀어왔음여기서 말하는 Parametric Model 들은 모델 학습동안 Training data의 정보를 model의 parameter에 absorbs(흡수) 시키는 방법들을 의미함이러한 모델들은 설명 가능하다는 장점을 가지나 복잡한 데이터 셋에서는 제대로 작동하기 힘듦이러한 상황에서 SVM이나 GP와 같은 Kernel based model의 등장은 보다 유연한 지평을 열게 됨Gaussian Process Definition임의의 집합 S가 있을 때, S에 대..
Prediction intervals (PI)는 point 예측과 관련된 불확실성 수준을 정량화하여 더 많은 정보를 제공할 수 있다는 점에서 제안되었는데, ref.[1]에서는 Nerual Network (NN) 기반 PI를 구축하는 방법을 최적의 조건에서 빠르게 실행할 수 있는 방법을 제안하였음. 제안된 Lower Upper Bound Estimation (LUBE) 추정 방법은 예측 구간 경계를 추정하기 위함이며, 대부분의 경우 PI 생성을 목적으로 사용되는 NN 구조에서는 PI 하한 및 상한에 각각 대응하는 단일 hidden layer와 두 개의 출력층으로 구성되고, 시뮬레이션을 통해 cost function 및 파라미터 최적화가 진행됨. Fig.19. 는 ref.[2]가 제안하는 PV 발전량 예측 ..
2월 말부터는 논문이랑 연구 과제 사업 관련해서 행정처리도 많고, 개강하고 연구실 일이 너무 많아서.. 내 연구를 몰입있게 못 했던 3월이었는데 어느 정도 해결되어서 3월 말부터는 다시 달려보려고 한다! - 프로그래머스 SQL 1일 1문제 풀기 및 포스팅 - 학부생 KCC2024 실험 및 논문 지도 - 대한전기학회 하계 학술대회 실험 및 논문 준비 - (제발 마지막) SCIE 연구 스터디 및 모델 구상
https://github.com/zhouhaoyi/Informer2020 GitHub - zhouhaoyi/Informer2020: The GitHub repository for the paper "Informer" accepted by AAAI 2021. The GitHub repository for the paper "Informer" accepted by AAAI 2021. - zhouhaoyi/Informer2020 github.com Transformer 모델이 장기 시퀀스 데이터에 대하여 효율적인 학습을 개선하기 위한 연구가 많이 진행되고 있는데, 기존 self-attention 메커니즘은 feature 간의 상관 계수를 직접 계산하여 시퀀스 내의 장기 의존성을 캡쳐할 수 있는 장점이 있으나..
작년 연구실 첫 출근 날짜가 1월 2일부터였으니, 석사 과정 딱 일 년째 되는 날이다 해가 갈수록 시간이 빠르게 지나가는 게 느껴지고, 마음의 여유가 점점 없어지는 것 같아서 변화를 주고 싶긴 하지만 시간은 연속적이니 시작에 많은 의미부여않고 이번 한 해 무탈하게 노력한 만큼 이뤄낼 수 있도록 노력해야겠다 티스토리 유입이 점점 다양해지는 것 같은데 방문하시는 모두 건강하세요 ❤️
신재생 에너지 발전 중 태양광 발전 (Photovoltaic)은 셀 단위당 에너지 생산량이 증가하고 있고, 친환경적인 발전으로 많은 연구가 진행되고 있다. 정확한 단기 PV 발전량 예측은 전력 계통에서 원활한 에너지 수급과 공급을 조절할 수 있기 때문에 경제적인 측면에서도 중요하다. 이러한 PV 시스템은 일사량과 PV 발전소 특성 및 기상요인으로 인해 에너지 발전량의 차이가 나는데, 불확실성을 줄이기 위해 이전부터 고전 통계 모델 / 인공지능 모델 / 하이브리드 모델 등을 사용하여 예측 오차를 줄이려는 시도가 증가하고 있다. 다음 포스팅에서는 내가 연구하고 있는 데이터를 적용해보고, 먼저 이번 포스팅에서는 LOESS(MSTL)와 TFT를 공부해보려한다. LOESS (MSTL) * Multiple Seas..
작업형 1 유형 score 값이 null 이 아닌 행만 가져와서 이상치에 해당하는 데이터 수 구하기 StandardScaler 적용해서 몇 이상인 데이터 수 구하기 df에서 가장 큰 상관관계를 갖는 컬럼명을 찾고, 그 컬럼의 평균 구하기 작업형 2 유형 회귀모델 구축하기 (평가지표: RMSE) 간단하게 GridSearch 해서 RF 돌렸음. 데이터 전처리에서는 결측치는 없었고 컬럼 더미화만 했음 작업형 3 유형 로지스틱 회귀 모형 구축 회귀 모형 구축 제 기억에는 위 문제 유형이었고, 1, 2 유형은 쉬웠는데 3이..ㅎ t-test나 chisquare anova 가 하나도 안나오고 모형 구축이어서 아쉬웠습니다.. help 쓰면서 푸는 내가 얼마나 킹받던지요... 붙은 것 같고 다음 8회차 응시하는 분들 ..
t-test 단일표본 t-검정 from scipy.stats import ttest_1samp # 귀무가설 : 평균키는 165이다 # 대립가설 : 평균키는 165가 아니다 # 1. 정규성을 만족하는가? # 2. ttest_1samp shapiros, p = shapiro(df) print(p) # 정규성을 갖지 않음! s, p, _ = ttest_1samp(df['height'], 165) print(p) # p-value는 0.0001로 대립가설을 채택한다. #따라서 평균키는 165가 아니다. 2. 대응(쌍체) 표본 t-검정 from scipy.stats import ttest_rel # 귀무가설: 혈류량의 변화가 있다 # 대립가설 : 혈류량의 변화가 없다 # 1. 정규성을 만족하는가? shapiro ..
https://www.datamanim.com/dataset/03_dataq/typetwo.html 작업 2유형 (파이썬) — DataManim 참고 모든 문제의 y_test값은 해당 url에서 y_test로 불러와 확인가능합니다. 실제로 제출을 위해 만든 데이터의 예측 점수를 확인해보세요 www.datamanim.com 작업형 2 유형은 분류/회귀 중 랜덤으로 나오고, 모듈 자동완성이 안되기 때문에..^^ 패키지까지 싸악 외워야한다! 간단한 데이터 전처리 및 모델 구축과 평가로 간단하게 진행하면 될 것 같다. (외워) 풀어보겠습니다~! 분류 (Classification) 1. 서비스 이탈 예측 데이터 import pandas as pd from sklearn.ensemble import RandomFo..