일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 웹크롤링
- dx
- hadoop
- ETRI
- 에트리 인턴
- httr
- SQL
- 에이블러
- KT AIVLE
- matplot
- 지도학습
- 시계열
- 머신러닝
- 프로그래머스
- 빅데이터분석기사
- 에이블스쿨
- 기계학습
- 가나다영
- arima
- ML
- kt aivle school
- 시각화
- python
- ggplot2
- 하계인턴
- cnn
- 하둡
- Eda
- 서평
- 다변량분석
- r
- 빅분기
- 소셜네트워크분석
- KT 에이블스쿨
- SQLD
- Ai
- 한국전자통신연구원
- 딥러닝
- kaggle
- 한국전자통신연구원 인턴
- Today
- Total
목록다변량분석 (4)
소품집
티스토리에 다변량 유입이 많아서 ... 졸업전에 올려둡니당 library(psych) library(MASS) library(PerformanceAnalytics) library(forecast) library(Metrics) library(MLmetrics) library(carData) # 데이터 확인 str(Prestige) summary(Prestige) # 결측치 제거 data
1. 상관계수 공분산 - 두 확률 변수 사이의 관계를 선형관계로 나타낼 때 두 변수 사이의 상관 정도를 타나내며 다음과 같이 구합니다. 두 확률변수 X, Y의 공분산은 𝐶𝑜𝑣 (𝑋, 𝑌 )로 표기하며, 공분산이 갖는 값에 따라 두 확률변수의 관계를 파악할 수 있습니다. 𝐶𝑜𝑣 𝑋, 𝑌 > 0 : 두 확률변수 𝑋, 𝑌 의 변화가 같은 방향임을 나타냅니다. 즉 𝑋 증가하 면 𝑌 도 증가하고, 반대로 한 변수가 감소하면 같이 감소합니다. 𝐶𝑜𝑣 𝑋, 𝑌 < 0 : 두 확률변수 𝑋, 𝑌 의 변화가 다른 방향임을 나타냅니다. 즉 𝑋 증가하 면 𝑌 는 감소, 즉 한 변수가 감소하면 다른 변수는 증가합니다. 𝐶𝑜𝑣 𝑋, 𝑌 = 0 : 두 확률변수 간에 어떠한 (선형) 관계가 없음을 나타냅니다. 상관계수 [-1~1] ..
setwd('/Users/dayeong/Desktop/21-2/전공/다변량 분석') # 범주형 데이터 분석 # MASS 패키지의 내장된 데이터(survey) 활용 library(MASS) library(ggplot2) data_s
library(UsingR) library(ggplot2) library(MASS) # 1.단일 모집단의 모평균에 대한 검정 및 신뢰구간 추정(1) data_1 유의수준 0.05에서 p-value는 0.001496로 귀무가설을 기각하게 된다. 따라서 모집단의 평균은 17보다 작다. # 1.단일 모집단의 모평균에 대한 검정 및 신뢰구간 추정(2) # 귀무가설: 선수들의 평균 출루율은 0.330이다. # 대립가설: 선수들의 평균 출루율은 0.330이 아니다 # 유의수준: 0.05 # -> 유의수준 0.05에서 p-value는 0.8663로 귀무가설을 채택하게 된다. 따라서 선수들의 평균 출루율은 0.330이다. hist(OBP) stem(OBP) t.test(OBP, mu=0.330, conf.level =..