回帰分析において起こる問題
時系列データの回帰分析においては、以下のことに留意する必要がある。
Multi-colinearity
・マルチコ。 多重共線性
・多少の相関は許容して分析を行う必要がある。
各説明変数のt値、回帰のRスクエアとF値から回帰の有効性を確認しつつ、マルチコの可能性があるか探っていく。
対処方法としては、相関している説明変数を省いていくこと。しかし、省くべき変数の特定は困難。
Serial correlation
・系列相関、auto correlationともいう
・残差が相関を持ってしまうこと。(「プラスの残差orマイナスの残差が続く」時期がある)
・検定方法
⇒trend modelにおいては、Durbin-Watson検定
DWは0〜4の値をとる。2に近ければ、系列相関の問題はない。ただし、0に近いほどPositive serial correlation 、4に近いほど negative serial correlationの可能性がある。
⇒AR過程においては、t検定
・対処方法
Hansen method ;
adjust coefficient standard error
UNIT ROOT
単位根。
被説明変数と説明 変数のうち、両者とも単位根をもつor持たない ならば回帰は成立するが、どちらか片方だけ単位根を持つ場合の回帰は見せかけの回帰となる。
Heteroskedasticity
不均一分散。 残差の分散が一定ではないこと。つまり、サンプル外でもっと広がりのある観測値がある。
重回帰の前提は、残差の分散が全サンプルで一定であることなので、不均一分散だと回帰が成立しない。
説明変数の値の水準と関係なく、分散が一定でない状態をUnconditional heteroskedasticityというが、特段大きな問題はない。
問題があるのは、残差の分散が 説明変数の値の水準と関連しているConditional heteroskedasticity。たとえば、説明変数の値が大きいほど残差の分散も大きくなるといった状況。
Breusch-Pagan chi-square test ; カイ二乗検定。
検定値=residualsの二乗を当説明変数で回帰したときのRsquare × サンプル数
自由度は、k (説明変数の数)