一般迴歸分析(Regression)是假設資料誤差是完全隨機的,但現實社會中的現象,卻往往不是如此,例如股價,它的波動會受到前一日或更前幾天的影響,因此,要建構這類的模型,我們就可以應用時間數列(Time Series),來分析或預測未來的走勢。
在談到時間數列前,我們最好先了解迴歸模型,以簡單線性迴歸為例:
y=a+bx+ε
其中ε為誤差, 假設他服從常態分數,平均數為0,變異數為σ2,且εi及εj無關聯
之後我們用誤差的最小平方法(Least Square),求出a及b,進而得到
- 總平方和(SST) = 殘差平方和(SSE) + 迴歸平方和(SSR)
- R2 = SSR / SST,R2是檢定x與y的相關係數
- 檢定一元迴歸可用自由度=n-2的t分配,多元迴歸則用F分配
F = (SSR / (k -1)) / (SSE / (n – k))
其中k-1為自變數個數
時間數列與迴歸分析不同點就是假設誤差不是完全隨機的, 而是自我相關的,即前期的誤差會影響後期的誤差
εt = ρεt -1 + at
其中ρ絕對值<1,at稱為干擾項(Disturbance Term),服從常態分數,平均數為0,變異數為σ2
- 檢定ρ是否為0,一階(誤差只與前一期有關)可用Dubin-Watson統計量檢定,多階可用ARIMA統計量。
- ARIMA: Auto Regression Integrated Moving Average,為Box/Jenkins提出
此外,若考慮不是σ2固定常數,也就是異質變異數(Heteroscendasticity),可用加權最小平方法處理,這就是ARCH或GARCH模型。
註:此文主要是節錄自林茂文先生所注之時間數列之分析與預測一書。
沒有留言:
張貼留言