自由度
##自由度とは何ですか?
自由度とは、データサンプル内の論理的に独立した値の最大数を指します。これは、自由に変化できる値です。
##自由度を理解する
自由度を概念的に理解する最も簡単な方法は、例を使用することです。
-簡単にするために、5つの正の整数で構成されるデータサンプルについて考えてみます。値は、それらの間に既知の関係がない任意の数にすることができます。このデータサンプルには、理論的には5つの自由度があります。
-サンプルの4つの数値は{3、8、5、および4}であり、データサンプル全体の平均は6であることがわかります。
-これは、5番目の数字が10でなければならないことを意味する必要があります。それ以外のことはできません。変化する自由はありません。
-したがって、このデータサンプルの自由度は4です。
自由度の式は、データサンプルのサイズから1を引いたものに等しくなります。
自由度は、カイ2乗など、統計におけるさまざまな形式の仮説検定に関連して一般的に議論されます。カイ二乗統計の重要性と帰無仮説の妥当性を理解しようとするときは、自由度を計算することが不可欠です。
##カイ二乗検定
カイ二乗検定には2つの異なる種類があります。「性別とSATスコアの間に関係はありますか?」などの関係の質問をする独立性の検定。適合度テストでは、 「コインを100回投げると、表は50回、尾は50回出ますか?」などと尋ねられます。
て、実験内の変数とサンプルの総数に基づいて、特定の帰無仮説を棄却できるかどうかを判断します。たとえば、学生とコースの選択を検討する場合、30人または40人の学生のサンプルサイズは、重要なデータを生成するのに十分な大きさではない可能性があります。 400人または500人の学生のサンプルサイズを使用した研究から同じまたは類似の結果を取得することは、より有効です。
##自由度の歴史
自由度の最も初期の最も基本的な概念は、1800年代初頭に注目され、数学者で天文学者のカールフリードリヒガウスの作品に絡み合っていました。この用語の現代的な使用法と理解は、英国の統計家であるウィリアム・シーリー・ゴセットが、匿名性を維持するために1908年にペンネームでBiometrikaに掲載された記事「TheProbable ErrorofaMean」で最初に説明されました。
彼の著作では、ゴセは「自由度」という用語を具体的に使用していませんでした。ただし、彼は、最終的にスチューデントのT分布として知られるものを開発する過程で、この概念について説明しました。実際の用語は1922年まで普及しませんでした。英国の生物学者で統計学者のロナルドフィッシャーは、カイ2乗の開発に関するレポートとデータの公開を開始したときに、「自由度」という用語を使い始めました。
##ハイライト
-自由度は、カイ2乗など、統計におけるさまざまな形式の仮説検定に関連して一般的に議論されます。
-自由度とは、データサンプル内の論理的に独立した値の最大数を指します。これは、自由に変化できる値です。
-カイ二乗統計の重要性と帰無仮説の妥当性を理解しようとする場合、自由度を計算することが重要です。