원본: https://arxiv.org/abs/2004.13408
시계열 연구 동향 관련해서 검색하면 이 논문 리뷰한게 많아서 간단하게 리뷰한 사람들 내용 요약
- 전통적인 방법들은 autoregressive(AR), exponential smoothing, structural time series models 등 도메인 전문 지식에 기반한 parametric 모델에 집중
- 최근 머신러닝 기반의 방법들은 순수하게 데이터 기반 시간 역학 학습 방식
시계열의 특성 : trend(추세성), Seasonality(계절성), Aberration(이변성), Volatility(변동성), Non-linearity(비선형성)
- Nonstationarity (비정상성)
- Statistical property가 시간이 지나도 변하지 않는 경우 stationarity
대부분의 time series data는 Nonstationary -> Seasonality, Concept drift, Change points
- 시간에 따라 시계열의 평균 수준이 다름
- 시간에 따라 시계열의 추세를 가짐
- 시간에 따라 시계열의 계절성을 보임
- 시간에 따라 시계열의 분산이 증가하거나 감소
- 시간에 따라 통계적 특성이 변한다
- 정상성의 만족 조건은 아래 와 같다.
- 해당 시계열 데이터가 관측 된 시간에 대해 무관한 데이터
- 평균이 일정
- 분산이 시점에 의존 하지 않음
- 공분산은 시차에만 의존하고, 시점 자체에 의존 하지는 않음
- 백색 잡음 (white Noise) 시계열
* 데이터가 정상성을 띄는지 비정상성을 띄는지에 따라 활용하는 모델이 다르므로 이를 파악하는 것은 필수
one-step-ahead 예측 모델은 다음과 같은 수식을 따름
- $\hat{y_i}, t+1$ : model forecast
- $y_i,t-k:t$ 와 $x_i,t-k:t$ : look-back window k에 대한 각각 타겟과 input의 관측치
- $s_i$ : entity와 관련된 통계적 metadata(sensor location 등)
- $f()$ : 모델에 의해 학습된 예측 함수
- 이 서베이에선 단변량 예측에 집중했지만, 일반성을 잃지 않고 동일한 구성 요소에 다변량 예측에 확장 可
Hybrid Models
Domain knowledge, non-probabilistic, probabilistic
- Domain knowledge
- Domain knowledge를 model에 반영하는 것은 hypothesis space를 줄여
- low data 환경에서 매우 효과적인 방법
- Hybrid models
- Non-probabilistic, probabilistic로 분류 할 수 있음
- Non-probabilistic의 경우 multiplicative level, seasonality components를 조합하여 구성
- Probabilistic의 경우 predictive distribution을 통해 Parameter를 생성
이 외의 상세한, 기본적인 시계열 예측 설계에 대한 내용은 아래 블로그 참조
https://sonstory.tistory.com/111
728x90
반응형
'TechStudy > TimeSeries' 카테고리의 다른 글
[문제해결] 모델 훈련시 불필요한 경고문 해결하기 (1) | 2024.11.18 |
---|---|
Recurrent Neural Networks for Multivariate Time Series With Missing Values(2016) (0) | 2024.10.16 |
시계열 Foundation 모델 최신 연구 동향 (LG 블로그) (0) | 2024.10.15 |
[펌] 딥러닝 기반 시계열 예측(Time Series Forecasting) 모델 동향 (~2022) (1) | 2024.10.14 |
ICLR 2024 학회 (LG 블로그 요약) (4) | 2024.10.14 |