시계열 5

[Time Series#5] 시계열 모형의 장기 예측 값에 대한 평균 수렴성

시계열 예측에서 중요한 질문 중 하나는 다음과 같습니다.“장기적으로 시계열의 예측값은 어떻게 될까?” 실제 예측 모델을 사용해 보면, 미래로 갈수록 예측값이 어떤 평균값에 가까워지는 현상을 관찰할 수 있습니다. 이 글에서는 시계열 모형에서 예측값이 시계열 평균으로 수렴하는 이유를 유도 과정을 포함해 살펴보겠습니다. AR예측값을 한 시점씩 전개하면 다음과 같습니다. 이를 일반화하 등비수열 합을 이용하면 정상성 조건에 의해서 예측값은 시계열의 평균으로 수렴합니다. MA MA 모델의 예측은 오차항의 기대값이 0이라는 특성을 이용합니다. 오차항이 더 이상 존재하지 않는 시점부터는 예측값은 상수 μ로 고정즉, 예측값은 q 시점을 지나면 곧바로 평균 μ로 수렴 ARMA 이 모델은 AR의 누적성과 MA의 절..

Time-Series 2025.04.25

[Time Series#4] 시계열 모형 (AR, MA, ARMA, ARIMA)

본 글에서는 여러가지 시계열 모형의 구성과 개념, 그리고 모델 선택 방법을 정리해보도록 하겠습니다. 정상 시계열 모형AR(p) (Auto-Regressive Model)자기회귀(AR) 모형은 현재의 관측값을 과거 시점의 값들로 설명하는 모델입니다.AR(1) (현재의 값이 1시점 이전의 값과 연관됨)AR(p) (일반화: 현재의 값이 p시점 이전의 값까지와 연관됨) AR 모델은 다음과 같은 특징을 가집니다.불확실 요소(impact 또는 innovation)는 정규분포를 따른다는 가정을 함계수는 독립적인 상수가 아니라 데이터의 평균과 관련됨모델의 정상성을 판단하려면 특성근(characteristic root)을 구해야 함.p=1일 때, 과거 1시점 이전의 값에 대한 계수의 절댓값이 1이하면 정상성 유지됨이때..

Time-Series 2025.04.25

[Time Series#3] Box-Cox 변환

시계열 데이터 분석을 진행하다 보면, 원시 데이터의 분포나 분산이 모델링에 적합하지 않은 경우가 많습니다.특히 예측 모델은 정상성(stationarity)을 기본 전제로 하는 경우가 많기 때문에, 데이터의 분산을 안정화하고 분포를 변환하는 과정이 필요합니다. 이때 유용하게 사용되는 대표적인 기법이 바로 박스-콕스(Box-Cox) 변환입니다. 왜 박스-콕스 변환을 사용하는가?박스-콕스 변환은 시계열 데이터를 모델에 투입하기 전에 사전 처리(preprocessing) 단계에서 적용하는 기법으로, 다음과 같은 효과를 기대할 수 있습니다.변동성 안정화: 데이터의 표준편차를 일정하게 유지하게 함비대칭 분포 개선: 오른쪽 꼬리가 긴 분포를 압축하여 정규성에 가까운 형태로 변환예측 성능 향상: 모델이 더 잘 작동..

Time-Series 2025.04.25

[Time Series#1] 시계열 분석이란?

시간 흐름에 따라 변하는 데이터를 다루는 시계열 분석은 주가, 날씨, 에너지 소비 등 다양한 분야에서 중요한 역할을 합니다. 이번 글에서는 시계열 분석과 예측의 핵심 개념들을 정리해보겠습니다. 시계열(Time Series)이란?시계열은 시간의 흐름에 따라 측정된 숫자형 데이터를 의미합니다.특정 시간 단위로 정렬된 이 데이터는 보통 과거의 값들과 일정한 패턴이나 관계를 갖고 있기 때문에, 이를 분석하면 미래의 값을 어느 정도 예측할 수 있습니다. 시계열 예시 하루 동안의 기온 변화한 달 동안의 가계 지출 내역매일 특정 키워드로 검색된 검색량시간대별 인터넷 트래픽주간 헬스장 이용자 수 변화 시계열 예측(Forecasting)이란?시계열 예측은 과거의 데이터를 바탕으로 미래 값을 추정하는 작업입니다.하지만 ..

Time-Series 2025.04.21

[NLP#5] LSTM

만약 기본적인 RNN에 대한 배경지식이 없으시면 간단하게 앞의 포스팅을 보고 오시면 이번 글을 읽으실 때 도움이 되실 겁니다. [NLP#4] 순환 신경망(RNN) 지난 포스팅에서는 word2vec에 대해서 알아보았습니다. [NLP#3] 추론 기반(word2vec) 지난 시간에는 통계 기반을 통해 단어의 분산 표현을 얻어내는 방법에 대해서 알아보았습니다. [NLP#2] 통계 기반 저 just-data.tistory.com RNN은 순환 경로를 통해 과거의 정보를 기억할 수 있도록 설계되어 있었습니다 구조도 단순하여 구현도 쉽게 할 수 있습니다. 하지만 기울기 소실, 폭발 등으로 인해 장기 기억을 잘 학습할 수 없어 성능이 좋지 못하다는 큰 단점이 존재합니다. 그래서 장기 기억을 잘 학습할 수 있도록 Gat..

NLP 2023.07.02