Investor's wiki

スプリアス相関

スプリアス相関

##スプリアス相関とは何ですか?

統計では、スプリアス相関(またはスプリアスネス)は、因果関係があるように見えるがそうではない2つの変数間の接続を指します。疑似相関では、変数間で観察された依存関係は、単に偶然によるものであるか、両方とも目に見えない交絡因子に関連しています。

##疑似相関を理解する

疑似関係は、最初は1つの変数が別の変数に直接影響することを示しているように見えますが、そうではありません。この誤解を招く相関関係は、多くの場合、検査時に明らかではない3番目の要因によって引き起こされます。これは、交絡因子と呼ばれることもあります。

2つのランダム変数がグラフ上で互いに密接に追跡している場合、一方の変数の変化がもう一方の変数の変化を引き起こすという相関関係を疑うのは簡単です。別のトピックである因果関係は別として、この観察により、チャートの読者は、変数Aの動きが変数Bの動きにリンクされている、またはその逆であると信じることができます。

ただし、より詳細な統計調査では、整列した動きが一致しているか、2つの変数に影響を与える3番目の要因によって引き起こされていることが示される場合があります。これは偽の相関関係です。小さなサンプルサイズまたは任意のエンドポイントで実施された調査は、特にスプリアスの影響を受けやすくなっています。

##スプリアスを見つける

調査結果で偽の関係を見つける最も明白な方法は、常識を使用することです。 2つのことが起こり、関連しているように見えるからといって、他の要因が働いていないことを意味するわけではありません。しかし、確実に知るために、研究方法は批判的に検討されています。

研究では、結果に影響を与える可能性のあるすべての変数を統計モデルに含めて、従属変数への影響を制御する必要があります。

###疑似相関

常識を使用することで、多くの疑似関係を特定できます。相関関係が見つかった場合、通常は複数の変数が使用されており、変数がすぐに明らかにならないことがよくあります。

##スプリアス相関の例

興味深い相関関係を見つけるのは簡単ですが、多くは偽物であることがわかります。 3つの例は、スカートの長さの理論、スーパーボウルの指標、およびレースと大学の修了率の間の推奨される相関関係です。

  1. スカートの長さの理論:1920年代に始まったスカートの長さの理論は、スカートの長さと株式市場の方向性が相関していると考えています。スカートの長さが長い場合、相関関係は株式市場が弱気であるということです。シャツの長さが短い場合、市場は強気です。

  2. スーパーボウルインジケーター:1月下旬には、いわゆるスーパーボウルインジケーターについておしゃべりが頻繁に発生します。これは、アメリカンフットボールカンファレンスチームの勝利は、今後株式市場が下落する可能性があることを示唆しています。一方、全国サッカー会議チームによる勝利は、市場の上昇を予感させます。 OpenMarketsによると、スーパーボウル時代の始まり以来、指標は約74%の確率で、つまり54年のうち40年で正確でした。これは楽しい会話の一部ですが、おそらく真面目な財務アドバイザーがクライアントの投資戦略として推奨するものではありません。

1。教育の達成と人種:社会科学者は、どの変数が教育の達成に影響を与えるかを特定することに焦点を当ててきました。政府の調査によると、同じ年齢の黒人のわずか36%と比較して、25〜29歳の白人の56%が2019年に大学の学位を取得しました。そのレースが大学の修了率に因果関係を持っているという意味合い。

ただし、教育の達成に影響を与えるのは人種そのものではない場合があります。結果はまた、社会における人種差別の影響によるものかもしれません。これは、3番目の「隠された」変数である可能性があります。人種差別は色の人々に影響を与え、教育的および経済的に不利な立場に置きます。たとえば、白人以外のコミュニティの学校はより大きな課題に直面し、資金も少なく、白人以外の人口の親は低賃金の仕事と子供の教育に専念するためのリソースが少なく、多くの家族は食の砂漠に住んでいて栄養失調に苦しんでいます。人種ではなく人種差別は、教育の達成に影響を与える原因変数と見なされる可能性があります。

##ハイライト

-因果関係の出現は、偶然であるか、3番目の「混乱」要因によって引き起こされたことが判明したチャート上の同様の動きが原因であることがよくあります。

-疑似相関、または疑似性は、2つの要因が互いに何気なく関連しているように見えるが、関連していない場合に発生します。

-因果関係を確認するには、考えられるすべての変数を制御する調査が必要です。

-統計学者と科学者は、慎重な統計分析を使用して、偽の関係を判断します。

-スプリアス相関は、サンプルサイズが小さいか任意のエンドポイントによって発生する可能性があります。

## よくある質問

###スプリアスリグレッションとは何ですか?

スプリアス回帰は、線形関係の誤解を招く統計的証拠を示す統計モデルです。言い換えれば、独立した非定常変数間の偽の相関関係です。

###相関関係の例はありますが、因果関係はありませんか?

相関関係の例は、睡眠が多いほど日中のパフォーマンスが向上することです。相関関係はありますが、必ずしも原因はありません。より多くの睡眠は、個人がより良いパフォーマンスをする理由ではないかもしれません。たとえば、生産性を向上させる新しいソフトウェアツールを使用している可能性があります。原因を見つけるには、睡眠とパフォーマンスの因果関係を示す研究からの事実の証拠がなければなりません。

###スプリアス相関を見つける方法は?

データを分析する統計家やその他の科学者は、常に疑似関係に注意を払う必要があります。それらを識別するために使用する方法は多数あります。-適切な代表サンプルの確保-適切なサンプルサイズの取得-任意のエンドポイントに注意する-できるだけ多くの外部変数を制御する-null仮説を使用し、強いpをチェックする-価値

###誤った因果関係とは何ですか?

誤った因果関係とは、それらの間の関係のために、あるものが別の何かを引き起こすという仮定を指します。たとえば、ハリーはレースタイムが改善されたため、より速いランナーになるために一生懸命トレーニングしていると推測できます。しかし、ハリーは最新のテクノロジーで作られた新しいランニングシューズを持っているため、レースタイムが改善されたのが現実かもしれません。最初の仮定は誤った因果関係でした。