Investor's wiki

適合度

適合度

##適合度とは何ですか?

適合度という用語は、サンプルデータが正規分布の母集団からの分布にどの程度適合しているかを判断する統計的検定を指します。簡単に言えば、サンプルが歪んでいるか、実際の母集団で見つかると予想されるデータを表しているかを仮定します。

適合度は、観測値と正規分布の場合のモデルに期待される値との間の不一致を確立します。適合度を判断するには、カイスクエアなど、複数の方法があります。

##適合度を理解する

適合度テストは、観測値について推測する統計的手法です。たとえば、サンプルグループが母集団全体を本当に代表しているかどうかを判断できます。そのため、実際の値がモデルの予測値にどのように関連しているかを判断します。意思決定に使用すると、適合度テストにより、将来の傾向とパターンを簡単に予測できます。

上記のように、適合性テストにはいくつかのタイプがあります。それらには、最も一般的なカイ2乗検定、コルモゴロフ-スミルノフ検定、およびシャピロ-ウィルク検定が含まれます。テストは通常、コンピュータソフトウェアを使用して実施されます。ただし、統計学者は、特定のタイプのテストに合わせた式を使用してこれらのテストを実行できます。

テストを実行するには、特定の変数と、それがどのように分散されるかを想定する必要があります。また、次のような明確で明示的な値を持つデータセットも必要です。

-実際のデータセットから導出された観測値

-行われた仮定から取られた期待値

-セット内のカテゴリの総数

適合度テストは、残差の正規性をテストするため、または2つのサンプルが同一の分布から収集されているかどうかを判断するために一般的に使用されます。

##特別な考慮事項

適合度検定を解釈するには、統計家がカイ2乗検定のp値などのアルファレベルを確立することが重要です。 p値は、観測された結果の極値に近い結果が得られる確率を指します。これは、帰無仮説が正しいことを前提としています。ヌル仮説は、変数間に関係が存在しないことを主張し、代替仮説は、関係が存在することを前提としています。

代わりに、観測値の頻度が測定され、その後、期待値と自由度とともに使用されて、カイ二乗が計算されます。結果がアルファよりも低い場合、帰無仮説は無効であり、変数間に関係が存在することを示します。

##適合度テストの種類

###カイ二乗検定

< mi>χ 2 </ mn> </ msup> = </ mo> ∑ </ mo> i </ mi> < mo> = </ mo> 1 </ mn> </ mrow> k </ mi> </ msubsup> (</ mo> O </ mi> i </ mi> </ msub> − </ mo> E </ mi> i </ mi> </ msub> )</ mo> 2 </ mn> </ msup> / </ mi> E </ mi> i </ mi> </ msub> </ mrow> \ chi ^ 2 = \ sum \ Limits ^ k_ (O_i-E_i)^ 2 / E_i </ annotation> </ semantics> </ math> </ span>