T検定
Tテストとは何ですか?
2つのグループの平均値の間に有意差があるかどうかを判断するために使用される一種の推論統計であり、特定の機能に関連している可能性があります。これは主に、コインを100回ひっくり返した結果として記録されたデータセットのように、データセットが正規分布に従い、未知の分散を持つ可能性がある場合に使用されます。 t-testは、母集団に適用可能な仮定のテストを可能にする仮説テストツールとして使用されます。
tテストでは、t統計、 t分布値、および自由度を調べて、統計的有意性を判断します。 3つ以上の手段でテストを実行するには、分散分析を使用する必要があります。
##Tテストの説明
基本的に、tテストを使用すると、2つのデータセットの平均値を比較して、それらが同じ母集団からのものであるかどうかを判断できます。上記の例で、クラスAの学生のサンプルとクラスBの学生の別のサンプルを取得した場合、それらがまったく同じ平均と標準偏差を持つことは期待できません。同様に、プラセボを与えられた対照群から採取されたサンプルと薬物処方群から採取されたサンプルは、わずかに異なる平均と標準偏差を持っているはずです。
数学的には、t検定は、2つのセットのそれぞれからサンプルを取得し、2つの平均が等しいという帰無仮説を仮定することによって問題ステートメントを確立します。適用可能な式に基づいて、特定の値が計算され、標準値と比較され、それに応じて、仮定されたnull仮説が受け入れられるか拒否されます。
null仮説が拒否される資格がある場合は、データの読み取りが強力であり、おそらく偶然によるものではないことを示しています。
tテストは、この目的で使用される多くのテストの1つにすぎません。統計家は、t検定以外の検定を追加で使用して、より多くの変数とより大きなサンプルサイズの検定を調べる必要があります。サンプルサイズが大きい場合、統計学者はzテストを使用します。他のテストオプションには、カイ二乗検定とf検定が含まれます。
tテストには3つのタイプがあり、それらは依存型と独立型のtテストに分類されます。
##あいまいなテスト結果
製薬会社が新しく発明された薬をテストしたいと考えてください。これは、あるグループの患者に薬を試し、コントロールグループと呼ばれる別のグループにプラセボを与えるという標準的な手順に従います。対照群に投与されたプラセボは、意図された治療的価値のない物質であり、実際の薬物を投与された他の群がどのように反応するかを測定するためのベンチマークとして機能します。
薬物試験後、プラセボを与えられた対照群のメンバーは平均寿命が3年増加したと報告し、新薬を処方されたグループのメンバーは平均寿命が4年増加したと報告した。即座の観察は、結果が薬を使用しているグループにとってより良いので、薬が実際に機能していることを示しているかもしれません。ただし、観察が偶然の発生、特に驚くべき幸運によるものである可能性もあります。 tテストは、結果が実際に正しく、母集団全体に適用できるかどうかを結論付けるのに役立ちます。
学校では、クラスAの100人の学生が平均85%を獲得し、標準偏差は3%でした。クラスBに属する別の100人の学生は、4%の標準偏差で平均87%を獲得しました。クラスBの平均はクラスAの平均よりも優れていますが、クラスBの学生の全体的なパフォーマンスがクラスAの学生のパフォーマンスよりも優れているという結論にジャンプするのは正しくない場合があります。これは、自然変動があるためです。両方のクラスのテストスコアが異なるため、違いは偶然によるものである可能性があります。 t検定は、一方のクラスがもう一方のクラスよりもうまくいったかどうかを判断するのに役立ちます。
##Tテストの仮定
tテストに関して行われる最初の仮定は、測定の規模に関するものです。 tテストの前提は、収集されたデータに適用される測定のスケールが、IQテストのスコアなどの連続的または通常のスケールに従うことです。
2番目の仮定は、単純なランダムサンプルの仮定であり、データは、総人口の代表的なランダムに選択された部分から収集されます。
3番目の仮定は、データをプロットすると、正規分布のベル型の分布曲線になるというものです。
1.最後の仮定は、分散の均一性です。サンプルの標準偏差がほぼ等しい場合、均一または等しい分散が存在します。
##Tテストの計算
t検定の計算には、3つの主要なデータ値が必要です。これらには、各データセットの平均値の差(平均差と呼ばれます)、各グループの標準偏差、および各グループのデータ値の数が含まれます。
tテストの結果はt値を生成します。次に、この計算されたt値は、臨界値テーブル(T分布テーブルと呼ばれる)から取得された値と比較されます。この比較は、差に対する偶然の影響のみ、および差がその偶然の範囲外であるかどうかを判断するのに役立ちます。 t検定は、グループ間の差が研究の真の差を表すのか、それとも意味のないランダムな差である可能性があるのかを質問します。
###T-分布表
T分布表は、片側および両側の形式で使用できます。前者は、明確な方向(正または負)の固定値または範囲を持つケースを評価するために使用されます。たとえば、サイコロを振ったときに出力値が-3未満のままになる確率、または7を超える確率はどれくらいですか?後者は、座標が-2と+2の間にあるかどうかを尋ねるなど、範囲境界分析に使用されます。
計算は、MSExcelにあるような必要な統計機能をサポートする標準のソフトウェアプログラムを使用して実行できます。
###T値と自由度
tテストは、出力として2つの値を生成します。t値と自由度です。 t値は、2つのサンプルセットの平均とサンプルセット内に存在する変動との差の比率です。分子値(2つのサンプルセットの平均の差)は簡単に計算できますが、分母(サンプルセット内に存在する変動)は、関連するデータ値のタイプによっては少し複雑になる可能性があります。比率の分母は、分散または変動性の測定値です。 tスコアとも呼ばれるt値の値が高い場合は、2つのサンプルセット間に大きな違いがあることを示しています。 t値が小さいほど、2つのサンプルセット間に類似性があります。
-大きなtスコアは、グループが異なることを示します。
-小さなTスコアは、グループが類似していることを示します。
自由度とは、変化する自由があり、ヌル仮説の重要性と妥当性を評価するために不可欠な研究の値を指します。これらの値の計算は通常、サンプルセットで使用可能なデータレコードの数に依存します。
##相関(または対応のある)T検定
相関tテストは、サンプルが通常、類似したユニットの一致するペアで構成されている場合、または測定が繰り返される場合に実行されます。たとえば、特定の治療を受ける前後に、同じ患者が繰り返し検査される場合があります。このような場合、各患者は自分自身に対する対照サンプルとして使用されています。
この方法は、サンプルが何らかの形で関連している場合や、子供、親、兄弟を含む比較分析のように、一致する特性を持っている場合にも適用されます。相関またはペアのtテストは、2セットのサンプルが関連している場合を含むため、依存型です。
ペアのtテストのt値と自由度を計算するための式は次のとおりです。
c-2.7,0、-7.17、-2.7、-13.5、-8c-5.8、-5.3、-9.5、-10、-9.5、-14
c0、-2,0.3、-3.3,1、-4c1.3、-2.7,23.83、-20.7,67.5、-54
c44.2、-33.3,65.8、-50.3,66.5、-51c1.3、-1.3,3、-2,5、-2c4.7,0,8.7,3.3,12,10
s173,378,173,378c0.7,0,35.3、-71,104、-213c68.7、-142,137.5、-285,206.5、-429
c69、-144、104.5、-217.7、106.5、-221
l0 -0
c5.3、-9.3、12、-14、20、-14
H400000v40H845.2724
s-225.272,467、-225.272,467s-235,486、-235,486c-2.7,4.7、-9,7、-19,7
c-6,0、-10、-1、-12、-3s-194、-422、-194、-422s-65,47、-65,47z
M834 80h400000v40h-400000z'/> </ svg> </ span> </ span> </ span> </ span> </ span> <span class =" vlist "style =" height:0.4196607142857143em; "> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> <span class =" pstrut "style =" height:3em; "> </ span > s </ span> (</ span> diff </ span> </ span> )</ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> <span class =" pstrut "style =" height:3.01em; "> </ span> <span class =" frac-line "style =" border-bottom-width:0.04em; "> </ span> </ span> </ span> 意味</ span> <spanclass = "mord"> 1 </ span> </ span> − </ span> <span class =" mspace "style =" margin-right:0.2222222222222222em; "> </ span> 意味</ span> <spanclass = "mord"> 2 </ span> </ span> </ span> </ span> < span class = "vlist-s"> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> <span class =" pstrut "style =" height:3.32144em; "> </ span> </ span> 場所:</ span> </ span> </ span> </ span> < / span> </ span> <spanclass="mordtextit">意味</ span> 1 </ span> <spanclass="mord">および</ span> 意味</ span> <spanclass = "mord"> 2 </ span> </ span> = </ span> </ span> 各サンプルセットの平均値</ span> </ span> </ span> </ span> </ span> s </ span> (</ span> diff </ span> </ span> )</ span> </ span> = </ span> </ span> <spanclass="mord">ペアのデータ値の差の標準偏差</ span> </ span> </ span> </ span> </ span> n </ span> </ span> < span class = "mrel"> = </ span> </ span> サンプルサイズ(ペアの違いの数)</ span> </ span> </ span> </ span> <spanstyle =" top:1.1940800000000005em; "> <span class =" pstrut "style =" height:3.32144em; "> </ span> </ span> n </ span> <span class =" mspace "style =" margin-right :0.2222222222222222em; "> </ span> − </ span> <span class =" mspace "style =" margin-right:0.2222222222222222em; "> </ span> 1 </ span> </ span> = </ span> <span class = " mspace "style =" margin-right:0.2777777777777778em; "> </ span> <spanclass="mord">自由度</ span> </ span > </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span> </ span>
1
残りの2つのタイプは、独立したtテストに属します。これらのタイプのサンプルは、互いに独立して選択されます。つまり、2つのグループのデータセットは同じ値を参照していません。これには、100人の患者のグループがそれぞれ50人の患者の2つのセットに分割されるようなケースが含まれます。一方のグループはコントロールグループになり、プラセボが与えられ、もう一方のグループは処方された治療を受けます。これは、互いに対になっていない2つの独立したサンプルグループを構成します。
##等分散(またはプール)T検定
等分散t-testは、各グループのサンプル数が同じである場合、または2つのデータセットの分散が類似している場合に使用されます。次の式は、等分散tテストのt値と自由度の計算に使用されます。