소품집

시계열 데이터란? & 시계열의 종류 본문

Time series

시계열 데이터란? & 시계열의 종류

sodayeong 2020. 4. 2. 21:36

시계열 데이터란? & 시계열의 종류


  시계열 데이터란 일정한 시간 동안 수집 된 일련의 순차적으로 정해진 데이터 셋의 집합입니다. 시계열 데이터의 특징으로는 시간에 관해 순서가 매겨져 있다는 점과, 연속한 관측치는 서로 상관관계를 갖고 있습니다.

 

  즉, 시계열 데이터의 분석 목적은 시계열이 갖고 있는 법칙성을 발견해 이를 모형화하고, 또 추정된 모형을 통하여 미래의 값을 forecasting 하는 것입니다.

 

 

 

time series data 표기법

 

시계열 자료의 종류


  • POS (Point of sales) 구매 자료 (불규칙적인 시차)
  • 일일 코스피 주식가격
  • 월별/분기별/연도별 특정 사건의 수치 (규칙적인 시차)

등 일어난 사건의 데이터 값을 모은 데이터 셋입니다.

 

 

 

시계열 자료 예시


 

  특히, 시계열 자료를 볼 때 유의해야할 점은 y축을 확인하여 노이즈 값에 영향을 많이 받는가 를 확인 해야합니다. 주기가 길 수록 스무스한 곡선을 띠는 한 편, facebook과 같은 데일리 데이터는 노이즈 값의 영향을 많이 받는 것으로 보입니다. 

 

 

 

 


 

시계열의 종류


변동요인을 보통 네 가지로 가정하면 변동요인을 파악할 수 있는데요.

즉 자료들의 특성을 단순화를 가정하는 방식입니다.

  • 추세변동
  • 계절변동
  • 순환변동
  • 불규칙 변동

1. 추세변동

  • 시계열의 장기간에 걸친 점진적이고 지속적인 변화 상태를 나타낸 것을 의미함
  • 시간의 흐름에 따른 시계열자료들의 상승경향이나 하강경향의 상태를 의미
  • 2.계절변동 (seasonal variation: S)

2. 계절변동

 

  • 관측된 시계열 자료들을 일 년 단위 혹은 더 짧은 기간의 주기로 기록했을 때 기후 등과 같은 자연의 조건, 사회적 관습, 혹은 제도 등의 영향을 받아서 계절적인 차이를 나타내는 것
  • 시계열 자료에서 주기적인 패턴을 갖고 반복적으로 나타나는 주기변동
  • 보통 분기별, 월별 자료에서 나타남

3. 순환변동

  • 경기변동이라고도 함
  • 수년간의 간격을 두고 상승과 하락이 주기적으로 나타나는 변동으로 의미
  • 기후조건, 사회적 관습 등과 같은 계절변동으로 설명되지 않는 장기적인 주기변동
  • 순환변동을 계절변동과 혼동할 수 있겠지만, 계절변동으로 설명되지 않는 장기적인 변동을 주기 변동을 뜻합니다.

 

4. 불규칙변동

  • 사전적으로 예상할 수 없는 특수한 사건에 의해 야기 되는 변동 (지진, 전쟁, 홍수, 파업)
  • 명확히 설명될 수 없는 요인에 의해 발생되는 우연변동 (시계열 데이턱 랜덤한 것인지를 확인할 필요가 있음)

 

 

 

 

 

 


다음 포스팅은 

R 기본 내장 된  AirPassengers 데이터로 기본 시계열 분석으로 시계열 분석을 해보겠습니다. 

 

 

 

본 포스팅은 순천향대 김영민 교수님의 시계열 분석을 정리한 내용입니다. 

728x90

'Time series' 카테고리의 다른 글

KPSS 검정  (0) 2020.06.08
ARIMA model & 정상성 파악  (0) 2020.06.05
시계열의 변동요인과 모형  (0) 2020.04.20
주가 시계열 자료 분석  (2) 2020.04.07
시계열 분석 - AirPassenger Data 등  (0) 2020.04.03
Comments