多重共線性
##多重共線性とは何ですか?
多重共線性は、重回帰モデルの2つ以上の独立変数間の高い相互相関の発生です。多重共線性は、研究者またはアナリストが統計モデルの従属変数を予測または理解するために各独立変数を最も効果的に使用できるかどうかを判断しようとすると、歪んだ結果または誤解を招く結果につながる可能性があります。
性は、モデル内の独立変数の効果に関して信頼性の低い確率を生成する、より広い信頼区間につながる可能性があります。
##多重共線性を理解する
統計アナリストは、重回帰モデルを使用して、2つ以上の独立変数の値に基づいて指定された従属変数の値を予測します。従属変数は、結果変数、ターゲット変数、または基準変数と呼ばれることもあります。
例としては、株価収益率(P / E比)、時価総額、過去のパフォーマンス、またはその他のデータなどの項目に基づいて株式のリターンを予測しようとする多変量回帰モデルがあります。株式リターンは従属変数であり、財務データのさまざまなビットは独立変数です。
重回帰モデルの多重共線性は、共線性の独立変数が何らかの形で関連していることを示していますが、関係は偶然である場合とそうでない場合があります。たとえば、過去のパフォーマンスは時価総額に関連している可能性があります。これは、過去にパフォーマンスが良かった株式の時価総額が増加するためです。
言い換えると、2つの独立変数が高度に相関している場合、多重共線性が存在する可能性があります。また、独立変数がデータセット内の他の変数から計算された場合、または2つの独立変数が同様の反復結果を提供する場合にも発生する可能性があります。
##特別な考慮事項
多重共線性の問題を排除する最も一般的な方法の1つは、最初に共線性の独立変数を識別し、次に1つを除くすべてを削除することです。
2つ以上の共線性変数を1つの変数に結合することにより、多重共線性を排除することもできます。次に、統計分析を実行して、指定された従属変数と単一の独立変数のみとの関係を調べることができます。
多重共線性を含むモデルからの統計的推論は信頼できない場合があります。
##多重共線性の例
###投資に
投資の場合、多重共線性は、株式や商品先物など、証券の予想される将来の価格変動を予測するためのテクニカル分析を実行する際の一般的な考慮事項です。
市場アナリストは、非常に類似した、または関連する入力に基づいているという点で、同一線上にある技術指標の使用を避けたいと考えています。それらは、価格変動の従属変数に関して同様の予測を明らかにする傾向があります。代わりに、市場分析は、異なる独立した分析の観点から市場を分析することを保証するために、著しく異なる独立変数に基づく必要があります。
潜在的な多重共線性の問題の例は、いくつかの同様の指標のみを使用してテクニカル分析を実行することです。
ボリンジャーバンド指標の作成者である著名なテクニカルアナリストのジョンボリンジャーは、 「テクニカル分析を成功させるための基本的なルールは、指標間の多重共線性を回避する必要がある」と述べています。この問題を解決するために、アナリストは同じタイプの2つ以上のテクニカルインジケーターの使用を避けます。代わりに、モメンタムインジケーターなどの1つのタイプのインジケーターを使用してセキュリティを分析し、次にトレンドインジケーターなどの別のタイプのインジケーターを使用して別の分析を実行します。
たとえば、ストキャスティクス、相対力指数(RSI) 、およびウィリアムズ%Rはすべて、同様の入力に依存し、同様の結果を生成する可能性が高い運動量指標です。この場合、1つを除くすべてのインジケーターを削除するか、それらのいくつかを1つのインジケーターにマージする方法を見つけると同時に、モメンタムインジケーターとの相関が高くない傾向インジケーターを追加することをお勧めします。
###生物学において
多重共線性は、他の多くのコンテキストでも観察されます。そのような文脈の1つは人間生物学です。たとえば、個人の血圧は年齢だけでなく、体重、ストレス、脈拍とも同一線上にあります。
##ハイライト
-多重共線性は、モデル内のいくつかの独立変数が相関している統計的概念です。
-独立変数間の多重共線性により、統計的推論の信頼性が低下します。
-2つ以上の変数を使用する重回帰モデルを作成する場合は、相関または反復のない独立変数を使用することをお勧めします。
-相関係数が+/-1.0の場合、2つの変数は完全に同一線上にあると見なされます。
-データセットに多重共線性が存在すると、標準誤差が大きくなるため、結果の信頼性が低下する可能性があります。
##よくある質問
###多重共線性が問題になるのはなぜですか?
多重共線性は、信頼性の低い回帰モデルの結果を生成するため、問題になります。これは、回帰係数の統計的有意性を低下させる可能性のある信頼区間が広い(標準誤差が大きい)ためです。
###多重共線性にどのように対処できますか?
モデルで検出される多重共線性の量を減らすために、最も共線性があると識別された特定の変数を削除できます。問題のある変数を組み合わせたり変換したりして、それらの相関を下げることもできます。それが機能しないか、達成できない場合は、リッジ回帰、主成分回帰、部分最小二乗回帰など、多重共線性をより適切に処理する修正回帰モデルがあります。
###多重共線性をどのように検出しますか?
分散拡大係数(VIF)と呼ばれる統計手法を使用して、重回帰モデルの共線性の量を検出および測定します。
###完全な共線性とは何ですか?
モデル内の2つの独立変数間に正確に1:1の対応がある場合、完全な共線性が存在します。これは、+1.0または-1.0の相関関係になります。