확인해보니 내가 공부할 내용은 5주차, 6주차에 걸쳐있는 것 같았다. 그래서 2,3,4 주차의 내용을 간단하게 개념만 알고 넘어가고 싶었다.
2주차의 내용은 시계열 데이터의 회귀 분석을 다루는 것 같다. 아마 회귀 분석을 이용해 예측하는 방법을 배우는 것 같다. 회귀 분석에 대해선 이미 통계학 시간에 배운 바가 있기 때문에 모르는 내용이 많을 것 같지는 않다.
3주차엔 Smoothing, 즉 시계열 데이터를 부드럽게 만드는 과정에 대해 배운다. 이 부분은 추측컨대 미분의 좌극한과 우극한을 같게 만들어 부드럽게 그래프를 변형시키는 과정을 다루는 것 같았다. 하지만 자세히 살펴보니 결국 선형회귀를 어느 정도 적용하여 미래 시계열 데이터를 예측하는 기법인 것 같다. 우리말로는 평활법이라고 하는데, moving average, exponential 외에도 기법이 여럿 존재한다. exponential smoothing이 가장 보편적으로 쓰이는 방법 같다.
4주차엔 Time Series Decomposition, 우리말로는 시계열 분해를 다룬다. 시계열 데이터라는 것이 "시간"을 객체로 갖기 때문에, 여러 요인에 영향을 받을 수밖에 없다. 그 요인들 Trend(추세성), Cycle(주기성), Seasonality(계절성), Irregular or Noise (불규칙 요인, 오차) 이렇게 4가지로 정리한다고 한다. 이는 앞으로도 계속해서 쓰이는 중요한 개념인 것 같다. 여기서 생각이 든 것이 다중선형회귀를 사용하는 것이 아닐까 싶다. 나중에 공부하다 보면 알게 될 것 같다.
'시계열 데이터' 카테고리의 다른 글
시계열 데이터 - 자기상관함수 ACF와 PACF (2) | 2023.01.15 |
---|---|
시계열 데이터 분석 이론 정리 - 정상성과 비정상성 (0) | 2023.01.09 |
시계열 데이터 - 정상성 분석하기, ADF test (0) | 2023.01.02 |
시계열 데이터 - 시계열 분해와 차분 (0) | 2022.12.30 |
시계열 데이터 - 정상성과 비정상성 (0) | 2022.12.27 |