両側検定
##両側検定とは何ですか?
統計における両側検定は、分布の臨界領域が両側であり、標本が特定の範囲の値より大きいか小さいかを検定する方法です。これは、すべての仮説検定および統計的有意性の検定で使用されます。テスト対象のサンプルがいずれかの重要な領域に該当する場合、帰無仮説の代わりに対立仮説が受け入れられます。
##両側検定を理解する
推論統計の基本的な概念は、仮説検定です。これは、母集団パラメーターが与えられた場合に、主張が真であるかどうかを判断します。標本の平均が母集団の平均よりも大幅に大きいか、または大幅に小さいかを示すように設計された仮説検定は、両側検定と呼ばれます。両側検定は、正規分布の両方の裾の下の領域を検定することからその名前が付けられていますが、この検定は他の非正規分布でも使用できます。
確率分布によって指定された指定されたデータ範囲の両側を調べるように設計されています。確率分布は、事前に決定された基準に基づいて指定された結果の可能性を表す必要があります。これには、範囲内に含まれる許容される最大(または上限)および最小(または下限)の変数値を指定する制限を設定する必要があります。上限より上または下限より下に存在するデータポイントは、許容範囲外であり、拒否範囲と呼ばれる領域にあると見なされます。
許容範囲内に存在しなければならないデータポイントの数に関する固有の基準はありません。医薬品の作成など、精度が要求される場合は、0.001%以下の不合格率が設定される場合があります。製品バッグ内の食品の数など、精度がそれほど重要ではない場合は、5%の拒否率が適切な場合があります。
##特別な考慮事項
両側検定は、特定の施設でのキャンディーの製造や包装など、企業での特定の製造活動中に実際に使用することもできます。生産施設が1袋あたり50キャンディーを目標として指定し、45〜55キャンディーの許容可能な分布である場合、45未満または55を超える量のバッグが見つかった場合は拒否範囲内と見なされます。
パッケージングメカニズムが期待される出力を満たすように適切に調整されていることを確認するために、ランダムサンプリングを行って精度を確認することができます。単純ランダムサンプルは、母集団全体の小さなランダムな部分を取り、データセット全体を表します。ここで、各メンバーは等しい確率で選択されます。
包装メカニズムが正確であると見なされるためには、適切な分布のバッグあたり平均50個のキャンディーが望まれます。さらに、拒否範囲内にあるバッグの数は、エラー率として許容できると見なされる確率分布制限内にある必要があります。ここで、帰無仮説は平均が50であるのに対し、対立仮説は50ではないというものです。
両側検定を実行した後、 zスコアが棄却域にある場合、つまり偏差が目的の平均から離れすぎている場合は、エラーを修正するために施設または関連機器の調整が必要になる場合があります。両側試験法を定期的に使用することで、生産が長期にわたって制限内にとどまるようにすることができます。
統計的検定が片側検定か両側検定かは、モデルの解釈に大きく影響するため、注意してください。
##両側検定と片側検定
サンプルの平均が母集団の平均よりも高いまたは低いことを示すように仮説検定が設定されている場合、これは片側検定と呼ばれます。片側検定の名前は、正規分布の裾(側面)の1つの下の領域を検定することから付けられました。片側検定を使用する場合、アナリストは、関心のある1つの方向での関係の可能性をテストし、別の方向での関係の可能性を完全に無視します。
テスト対象のサンプルが片側の臨界領域に該当する場合、帰無仮説の代わりに対立仮説が受け入れられます。片側検定は、方向性仮説または方向性検定とも呼ばれます。
一方、両側検定は、指定されたデータ範囲の両側を調べて、サンプルが値の範囲よりも大きいか小さいかをテストするように設計されています。
##両側検定の例
架空の例として、XYZという名前の新しい株式仲買人が、仲介手数料が現在の株式仲買人ABCよりも低いと主張していると想像してください)独立した調査会社から入手可能なデータは、すべてのABCブローカークライアントの平均と標準偏差がそれぞれ18ドルと6ドル。
ABCの100のクライアントのサンプルが取得され、仲介手数料はXYZブローカーの新しいレートで計算されます。サンプルの平均が18.75ドルで、サンプルの標準偏差が6ドルの場合、ABCブローカーとXYZブローカーの平均ブローカー請求額の違いについて推測できますか?
--H〜0〜:帰無仮説:平均= 18
--H〜1〜:対立仮説:平均<> 18(これが私たちが証明したいことです。)
-棄却域:Z <= --Z〜2.5〜およびZ> = Z〜2.5〜(5%の有意水準を想定し、両側でそれぞれ2.5に分割)。
--Z =(サンプル平均–平均)/(std-dev / sqrt(サンプル数))=(18.75 – 18)/(6 /(sqrt(100))= 1.25
この計算されたZ値は、次のように定義された2つの制限の間にあります。-Z〜2.5〜= -1.96およびZ〜2.5〜=1.96。
<!-86D8AFA59A07E1D9B51E82FACD003489->
これは、既存のブローカーと新しいブローカーのレートに違いがあることを推測するには証拠が不十分であると結論付けています。したがって、帰無仮説を棄却することはできません。あるいは、p値= P(Z <-1.25)+ P(Z> 1.25)= 2 * 0.1056 = 0.2112 = 21.12%であり、0.05または5%より大きい場合、同じ結論になります。
##ハイライト
-慣例により、両側検定を使用して5%レベルで有意性を決定します。つまり、分布の両側が2.5%にカットされます。
-統計では、両側検定は、分布の臨界領域が両側であり、サンプルが値の範囲よりも大きいか小さいかをテストする方法です。
-帰無仮説検定および統計的有意性の検定で使用されます。
-テスト対象のサンプルがいずれかの重要な領域に該当する場合、帰無仮説の代わりに対立仮説が受け入れられます。
## よくある質問
Zスコアとは何ですか?
Zスコアは、値のグループの平均に対する値の関係を数値で表し、平均からの標準偏差の数で測定されます。 Zスコアが0の場合、データポイントのスコアが平均スコアと同じであることを示しますが、1.0および-1.0のZスコアは、平均より1標準偏差上または下の値を示します。ほとんどの大規模なデータセットでは、値の99%のZスコアが-3から3の間であり、平均の上下3標準偏差内にあることを意味します。
###両側検定はどのように設計されていますか?
両側検定は、母集団パラメーターが与えられた場合に、主張が真であるかどうかを判断するように設計されています。関係する確率分布によって指定された、指定されたデータ範囲の両側を調べます。したがって、確率分布は、事前に決定された基準に基づいて指定された結果の可能性を表す必要があります。
###両側検定と片側検定の違いは何ですか?
両側仮説検定は、標本の平均が母集団の平均よりも大幅に大きいか、大幅に小さいかを示すように設計されています。両側検定は、正規分布の両側(側面)の下の領域を検定することからその名前が付けられています。一方、片側仮説検定は、サンプルの平均が母集団の平均よりも高いまたは低いことを示すために設定されます。