Investor's wiki

分散拡大係数(VIF)

分散拡大係数(VIF)

##分散拡大係数(VIF)とは何ですか?

分散拡大係数(VIF)は、複数の回帰変数のセットにおける多重共線性の量の尺度です。数学的には、回帰モデル変数のVIFは、その単一の独立変数のみを含むモデルの分散に対するモデル全体の分散の比率に等しくなります。この比率は、独立変数ごとに計算されます。高いVIFは、関連する独立変数がモデル内の他の変数と高度に共線的であることを示します。

##分散拡大係数(VIF)を理解する

分散拡大係数は、多重共線性の程度を特定するのに役立つツールです。重回帰は、特定の結果に対する複数の変数の影響をテストする場合に使用されます。従属変数は、独立変数(モデルへの入力)によって作用されている結果です。多重共線性は、1つ以上の独立変数または入力の間に線形関係または相関がある場合に存在します。

多重共線性は、入力がすべて互いに影響し合うため、重回帰で問題を引き起こします。したがって、それらは実際には独立しておらず、独立変数の組み合わせが回帰モデル内の従属変数または結果にどの程度影響するかをテストすることは困難です。

統計的には、多重共線性が高い重回帰モデルでは、各独立変数と従属変数の関係を推定することがより困難になります。使用されるデータまたはモデル方程式の構造に小さな変化があると、独立変数の推定係数に大きくて不安定な変化が生じる可能性があります。

モデルが適切に指定され、正しく機能していることを確認するために、多重共線性について実行できるテストがあります。分散拡大係数は、そのような測定ツールの1つです。分散拡大係数を使用すると、多重共線性の問題の重大度を特定して、モデルを調整できるようになります。分散拡大係数は、独立変数の振る舞い(分散)が、他の独立変数との相互作用/相関によってどの程度影響を受けるか、または膨張するかを測定します。

回帰の標準エラーにどの程度寄与しているかをすばやく測定できます。重大な多重共線性の問題が存在する場合、関連する変数の分散拡大係数は非常に大きくなります。これらの変数が特定された後、いくつかのアプローチを使用して、共線性変数を削除または結合し、多重共線性の問題を解決できます。

##多重共線性

多重共線性はモデルの全体的な予測力を低下させませんが、統計的に有意ではない回帰係数の推定値を生成する可能性があります。ある意味では、それはモデルにおける一種の二重カウントと考えることができます。

2つ以上の独立変数が密接に関連しているか、ほぼ同じものを測定している場合、それらが測定する根本的な影響は、変数全体で2回(またはそれ以上)説明されます。どの変数が実際に独立変数に影響を与えているかを判断するのは困難または不可能になります。多くの計量経済モデルの目標は、独立変数と従属変数の間のこの種の統計的関係を正確にテストすることであるため、これは問題です。

たとえば、経済学者が失業率(独立変数)とインフレ率(従属変数)の間に統計的に有意な関係があるかどうかをテストしたいとします。失業率に関連する追加の独立変数を含めると、そのような新しい初期の失業率の主張は、モデルに多重共線性を導入する可能性があります。

全体的なモデルは、強力で統計的に十分な説明力を示している可能性がありますが、その影響が主に失業率によるものなのか、新しい最初の失業率によるものなのかを特定することはできません。これはVIFが検出するものであり、研究者がテストに関心のある特定の仮説に応じて、変数の1つをモデルから削除するか、変数を統合して共同効果を取得する方法を見つけることを提案します。

##ハイライト

-分散拡大係数(VIF)は、重回帰モデルの独立変数間の多重共線性の尺度を提供します。

-多重共線性の検出は重要です。多重共線性はモデルの説明力を低下させませんが、独立変数の統計的有意性を低下させるためです。

-独立変数の大きな分散拡大係数(VIF)は、モデルの構造と独立変数の選択で考慮または調整する必要がある他の変数との共線性が高いことを示します。