일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 빅데이터분석기사
- cnn
- httr
- 한국전자통신연구원
- arima
- SQLD
- ETRI
- kaggle
- 빅분기
- kt aivle school
- 하둡
- 에이블러
- 프로그래머스
- 머신러닝
- 기계학습
- 에이블스쿨
- KT AIVLE
- 하계인턴
- ML
- 가나다영
- hadoop
- 소셜네트워크분석
- matplot
- KT 에이블스쿨
- 지도학습
- python
- 시각화
- Eda
- 시계열
- Ai
- r
- 딥러닝
- 다변량분석
- 서평
- ggplot2
- SQL
- 에트리 인턴
- 한국전자통신연구원 인턴
- dx
- 웹크롤링
- Today
- Total
목록회귀분석 (3)
소품집
티스토리에 다변량 유입이 많아서 ... 졸업전에 올려둡니당 library(psych) library(MASS) library(PerformanceAnalytics) library(forecast) library(Metrics) library(MLmetrics) library(carData) # 데이터 확인 str(Prestige) summary(Prestige) # 결측치 제거 data
1. 상관계수 공분산 - 두 확률 변수 사이의 관계를 선형관계로 나타낼 때 두 변수 사이의 상관 정도를 타나내며 다음과 같이 구합니다. 두 확률변수 X, Y의 공분산은 𝐶𝑜𝑣 (𝑋, 𝑌 )로 표기하며, 공분산이 갖는 값에 따라 두 확률변수의 관계를 파악할 수 있습니다. 𝐶𝑜𝑣 𝑋, 𝑌 > 0 : 두 확률변수 𝑋, 𝑌 의 변화가 같은 방향임을 나타냅니다. 즉 𝑋 증가하 면 𝑌 도 증가하고, 반대로 한 변수가 감소하면 같이 감소합니다. 𝐶𝑜𝑣 𝑋, 𝑌 < 0 : 두 확률변수 𝑋, 𝑌 의 변화가 다른 방향임을 나타냅니다. 즉 𝑋 증가하 면 𝑌 는 감소, 즉 한 변수가 감소하면 다른 변수는 증가합니다. 𝐶𝑜𝑣 𝑋, 𝑌 = 0 : 두 확률변수 간에 어떠한 (선형) 관계가 없음을 나타냅니다. 상관계수 [-1~1] ..
Linear Regression (선형회귀) 수식 미분으로 한 번에 구하는 방법 sum of squared error를 최소화 하기 위해 미분하여 얻은 최소화 된 식은 y = Xb (Xt)y = (Xt)Xb[(Xt)X]^(-1)(Xt)y = [(Xt)X]^(-1)(Xt)Xb [(Xt)X]^(-1)(Xt)y = b 즉, 주어진 데이터 (x,y)만 있으면 위 수식으로 한 번에 파라미터(beta값 ==기울기) 를 계산할 수 있음 계산이 끝나면, 그 파라메터로 테스트 데이터에 적용하여 예측값 ^y 생성이 가능함 Iterative(반복 수행) 방법으로 학습하는 방법 데이터 (각각 (x,y)값으로 취급) (2,5), (3,7), (4,9), (5,11) 선형 모델 가정하기: ax+by+c=0 (파라메터: a,b,c..