カイ二乗(χ2)統計
##カイ二乗統計とは何ですか?
カイ二乗(χ ^ 2 ^)^^統計は、モデルが実際の観測データとどのように比較されるかを測定する検定です。カイ2乗統計の計算に使用されるデータは、ランダムで、生で、相互に排他的で、独立変数から抽出され、十分な大きさのサンプルから抽出されている必要があります。たとえば、公正なコインを投げた結果はこれらの基準を満たしています。
カイ二乗検定は、仮説検定でよく使用されます。カイ二乗統計は、サンプルのサイズと関係の変数の数を前提として、期待される結果と実際の結果の間の不一致のサイズを比較します。
これらのテストでは、自由度を利用して、実験内の変数とサンプルの総数に基づいて、特定の帰無仮説を棄却できるかどうかを判断します。他の統計と同様に、サンプルサイズが大きいほど、結果の信頼性が高くなります。
##カイ二乗の公式は
1
##カイ二乗統計は何を教えてくれますか?
カイ二乗検定には主に2つの種類があります。「学生の性別とコース選択の間に関係はありますか?」などの関係の質問をする独立性の検定。そして、 「私の手にあるコインは理論的に公正なコインとどれくらい一致するか」のようなものを尋ねる適合度テスト。
カイ二乗分析はカテゴリ変数に適用され、それらの変数が名目上の場合(結婚歴や性別などの順序が重要でない場合)に特に役立ちます。
### 独立
学生の性別とコースの選択を検討する場合、独立性のχ 2検定を使用できます。このテストを行うために、研究者は選択された2つの変数(選択された性別とコース)に関するデータを収集し、上記の式とχ を使用して、提供されたクラスから男性と女性の学生が選択する頻度を比較します。 2統計表。
性別とコース選択の間に関係がない場合(つまり、彼らが独立している場合)、男性と女性の学生が提供された各コースを選択する実際の頻度は、ほぼ等しいか、逆に、男性と選択したコースの女性の学生は、サンプルの男性と女性の学生の比率とほぼ同じである必要があります。
独立性のχ^2 ^検定は、ランダムな偶然がデータの実際の頻度とこれらの理論上の期待値との間に観察された違いを説明できる可能性がどれほどあるかを示します。
###適合度
χ^2 ^は、データのサンプルが、サンプルが表すことを意図しているより大きな母集団の(既知または想定される)特性とどの程度一致しているかをテストする方法を提供します。これは適合度として知られています。サンプルデータが、関心のある母集団の期待される特性に適合しない場合は、このサンプルを使用して、より大きな母集団について結論を出すことは望ましくありません。
## 例
たとえば、表または裏に着地する確率が正確に50/50の架空のコインと、100回投げる実際のコインについて考えてみます。このコインが公平であれば、どちらの側にも同じ確率で着地します。コインを100回投げると、表が50回、尾が50回上がると予想されます。
この場合、χ ^ 2 ^は、100回のコインフリップの実際の結果が、公正なコインで50/50の結果が得られるという理論モデルと比較してどれだけ優れているかを示します。実際のトスは50/50、60/40、さらには90/10になる可能性があります。 100回のトスの実際の結果が50/50から離れるほど、このトスのセットの適合性は理論上の50/50の予想に合わなくなり、このコインは実際にはフェアコイン。
##Chi-Squareテストを使用する場合
カイ二乗検定は、観測された結果が期待される結果と一致しているかどうかを判断し、観測が偶然によるものであることを除外するために使用されます。分析対象のデータがランダムサンプルからのものであり、問題の変数がカテゴリ変数である場合、カイ2乗検定がこれに適しています。カテゴリ変数は、車のタイプ、人種、学歴、男性と女性、政治家候補がどれだけ好きか(非常に多いものから非常に少ないものまで)などの選択で構成される変数です。
これらのタイプのデータは、多くの場合、調査の回答またはアンケートを介して収集されます。したがって、カイ二乗分析は、このタイプのデータの分析に最も役立つことがよくあります。
##ハイライト
-χ^2 ^は、実際の値と観測値の差のサイズ、自由度、およびサンプルサイズによって異なります。
-カイ2乗(χ ^ 2 ^)^^統計は、一連のイベントまたは変数の結果の観測された頻度と期待された頻度の差の尺度です。
-カイ2乗は、カテゴリ変数、特に本質的に名目上の変数のこのような違いを分析するのに役立ちます。
-観測された分布と理論的な周波数分布の間の適合度をテストするためにも使用できます。
-χ^2 ^を使用して、2つの変数が互いに関連しているか独立しているかをテストできます。
## よくある質問
###独立変数が名義変数または順序変数の場合、カイ2乗分析が使用されますか?
名義変数は、品質によって異なるカテゴリ変数ですが、その数値の順序は無関係である可能性があります。たとえば、誰かに好きな色を尋ねると、名目変数が生成されます。一方、誰かの年齢を尋ねると、序数のデータセットが生成されます。カイ二乗は、名目データに最適に適用できます。
###カイ二乗分析を使用するのは誰ですか?
カイ二乗はカテゴリ変数に適用されるため、調査の回答データを研究している研究者によって最もよく使用されます。このタイプの調査は、人口統計学から消費者およびマーケティング調査、政治学および経済学にまで及ぶ可能性があります。
###カイ二乗検定は何に使用されますか?
カイ二乗は、期待される結果と観測された結果の間の適合度を判断するために、ランダムサンプルからのカテゴリ変数間の差異を調べるために使用される統計的検定です。