格蘭傑因果關係檢驗(英語:Granger causality test)是一種假設檢定的統計方法,檢驗一組時間序列是否為另一組時間序列的原因。它的基礎是迴歸分析當中的自迴歸模型。迴歸分析通常只能得出不同 變量間的同期 相關性;自迴歸模型只能得出同一 變量前後期 的相關性;但諾貝爾經濟學獎得主克萊夫·格蘭傑(Clive Granger)於1969年論證[1] ,在自迴歸模型中透過一系列的檢驗進而揭示不同變量之間的時間落差相關性是可行的。
格蘭傑本人在其2003年獲獎演說中強調了其引用的局限性,以及「很多荒謬論文的出現」(Of course, many ridiculous papers appeared)。格蘭傑因果關係檢驗的結論只是一種統計估計,不是真正意義上的因果關係,不能作爲肯定或否定因果關係的根據。同時,格蘭傑因果關係檢驗也有一些不足之處,如並未考慮干擾因素的影響,也未考慮時間序列間非線性的相互關係。一些基於格蘭傑因果關係檢驗的方法一定程度上解決了這些問題[2]。
核心概念
過去值(lag value,或稱落後期):同一變項比當期時間上更早的值。例如:當期為,它的落後期為。
格蘭傑因果關係檢驗的基本觀念在於:未來的事件不會對目前與過去產生因果影響,而過去的事件才可能對現在及未來產生影響。[1][3] 也就是說,如果我們試圖探討變數是否對變數有因果影響,那麼只需要估計的落後期是否會影響的現在值,因為的未來值不可能影響的現在值。假如在控制了變數的過去值以後, 變數的過去值仍能對Y 變數有顯著的解釋能力,我們就可以稱能「Granger 影響」(Granger-cause)。[4]
最初版的格蘭傑因果測試,有時候無法發現真正的因果關係。因為雖然對於認定因果關係而言,理論上還必須控制其他可能的干擾因素,但在 Granger 最初提出這套因果測試的版本中,並未納入干擾變數的分析,而是假設其他可能解釋變數的資訊包含在的落後值中。如果事實上帶來因果關係的是第三變數(干擾變數),亦即若事實上操控 並無法改變 ,格蘭傑因果關係的零假設仍然可能被拒絕。因此標準版的格蘭傑因果測試結果可能會產生誤導性。
1980年代由其他的計量經濟學家對Granger測試加以修改、擴充,將可能的第三(以上)變數納入測試,成為使用追蹤資料的向量自迴歸模型(英語:panel data VAR model)。相較於最初版的 Granger 測試,擴充版可以產生更有效的估計結果。[4]
步驟描述
- 準備工作:一開始要用幾個落後期來建立模型,需要研究者的評估,通常使用 赤池資訊量準則(英語:Akaike information criterion、簡稱AIC) 或 貝氏訊息量準則(英語:Bayesian information criterion、簡稱BIC)來判斷。
- 格蘭傑因果關係檢驗的第一步是建立用的落後期來預測的自迴歸模型。此際,如果時間序列是廣義平穩的,則可以直接使用落後期。如果不平穩,就必須對不平穩的時間序列先做(一階或更多階)差分,直到得出平穩時間數列。
- 如果發現 的某期落後期 (1) 在迴歸分析中具有顯著性(根據 t檢驗的p值來判斷),且 (2) 這期落後期加入模型後可提高迴歸模型的解釋力(根據迴歸分析的F檢驗),這個落後期便被留在模型中。
- 然後進一步加入(或Δ)的滯後期來擴充迴歸模型。關於平穩時間序列的要求、某期落後期留在模型中的條件,同上述的處理。
- 當且僅當(充分必要)沒有任何解釋變項(或Δ)的落後期被留在模型中,便無法拒絕無格蘭傑因果關係的零假設。
研究人員希望發現明顯的證據,比如是的格蘭傑原因但反之不成立,便能做出因果關係的推論。然而在實際操作中也可能會發現沒有變量是對方的格蘭傑原因,或者和兩個變量互為格蘭傑原因。
1. 令和為廣義平穩序列。如要檢測非的格蘭傑原因之零假設,首先引入的落後期建立的自迴歸模型(AR model on ):
- 所有的落後期中:(1) 在迴歸分析中具有顯著性(根據t-統計值的p值來判斷)的,且 (2) 這期落後期加入模型後可提高迴歸模型的解釋力(根據迴歸分析的F檢驗)的--將被留在模型中。表示的是變量滯後期中檢驗為顯著的時間上最早一個。
2. 接着,引入的落後期建立增廣迴歸模型:
- 所有的落後期中:(1) 在迴歸分析中具有顯著性(根據t檢驗的p值來判斷)的,且 (2) 這期落後期加入模型後可提高迴歸模型的解釋力(根據迴歸分析的F檢驗)的--將被留在模型中。在以上增廣迴歸模型中,代表變量落後期中檢驗為顯著的時間上最早一個,則是變量落後期中檢驗為顯著的時間上最近一個。
3. 如果沒有任何的落後期被留在模型中,無格蘭傑因果關係的零假設就成立。
一些統計軟體可以執行Granger causality test。例如:Stata、SPSS[5]、EViews[6]、R語言。
這裏舉個R語言中lmtest程序庫裏grangertest()指令的例子:
Granger causality test Model 1: fii ~ Lags(fii, 1:5) + Lags(rM, 1:5) Model 2: fii ~ Lags(fii, 1:5) Res.Df Df F Pr(>F) 1 629 2 634 5 2.5115 0.02896 * --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Granger causality test Model 1: rM ~ Lags(rM, 1:5) + Lags(fii, 1:5) Model 2: rM ~ Lags(rM, 1:5) Res.Df Df F Pr(>F) 1 629 2 634 5 1.1804 0.3172
模型1檢驗將滯後的rM從解釋FII的回歸模型中移除是否可行,答案是不可行的(因為p值 = 0.02896)。但由模型1和模型2的組合可發現從解釋rM的模型中移除FII的落後期是可能的。我們可以由此斷定rM是FII的格蘭傑原因,反之則不成立。
延伸
承繼著回歸模型的基本性質,格蘭傑因果關係分析也假設實際值與預測值之間的誤差呈正態分佈,若實際現象不呈正態分佈將嚴重影響推論的有效性。
Hacker & Hatemi-J (2006)發展出一種不必在乎誤差項是否呈正態分佈的格蘭傑因果關係研究方法[7]。這種方法在財金分析上特別實用, 因為許多金融變量不服從正態分佈。[8]
近來,Hacker & Hatemi-J (2012)又進一步改善之,提出一種非對稱的因果關係檢驗模型,據說可以區分正向與負向影響的因果影響。[9]
時變格蘭傑因果關係:將格蘭傑因果關係擴展到動態的時變性質,可以更細緻地了解時間序列數據中的因果關係是如何隨時間演變的。[10] 該方法使用遞歸技術,如前向展(FE)、滾動(RO)和遞歸演化(RE)窗口,以克服傳統格蘭傑因果檢驗的局限性,並理解不同時期因果關係的變化。[11] 這一方法的核心是 Stata 中的 "tvgc "命令。[10]經驗應用,如涉及以太坊交易費用和經濟子系統的數據,突出了經濟關係隨時間變化的動態性質。[12]
註腳
相關條目
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.