T検定

Tテストとは何ですか？

2つのグループの平均値の間に有意差があるかどうかを判断するために使用される一種の推論統計であり、特定の機能に関連している可能性があります。これは主に、コインを100回ひっくり返した結果として記録されたデータセットのように、データセットが正規分布に従い、未知の分散を持つ可能性がある場合に使用されます。 t-testは、母集団に適用可能な仮定のテストを可能にする仮説テストツールとして使用されます。

tテストでは、t統計、 t分布値、および自由度を調べて、統計的有意性を判断します。 3つ以上の手段でテストを実行するには、分散分析を使用する必要があります。

##Tテストの説明

基本的に、tテストを使用すると、2つのデータセットの平均値を比較して、それらが同じ母集団からのものであるかどうかを判断できます。上記の例で、クラスAの学生のサンプルとクラスBの学生の別のサンプルを取得した場合、それらがまったく同じ平均と標準偏差を持つことは期待できません。同様に、プラセボを与えられた対照群から採取されたサンプルと薬物処方群から採取されたサンプルは、わずかに異なる平均と標準偏差を持っているはずです。

数学的には、t検定は、2つのセットのそれぞれからサンプルを取得し、2つの平均が等しいという帰無仮説を仮定することによって問題ステートメントを確立します。適用可能な式に基づいて、特定の値が計算され、標準値と比較され、それに応じて、仮定されたnull仮説が受け入れられるか拒否されます。

null仮説が拒否される資格がある場合は、データの読み取りが強力であり、おそらく偶然によるものではないことを示しています。

tテストは、この目的で使用される多くのテストの1つにすぎません。統計家は、t検定以外の検定を追加で使用して、より多くの変数とより大きなサンプルサイズの検定を調べる必要があります。サンプルサイズが大きい場合、統計学者はzテストを使用します。他のテストオプションには、カイ二乗検定とf検定が含まれます。

tテストには3つのタイプがあり、それらは依存型と独立型のtテストに分類されます。

##あいまいなテスト結果

製薬会社が新しく発明された薬をテストしたいと考えてください。これは、あるグループの患者に薬を試し、コントロールグループと呼ばれる別のグループにプラセボを与えるという標準的な手順に従います。対照群に投与されたプラセボは、意図された治療的価値のない物質であり、実際の薬物を投与された他の群がどのように反応するかを測定するためのベンチマークとして機能します。

薬物試験後、プラセボを与えられた対照群のメンバーは平均寿命が3年増加したと報告し、新薬を処方されたグループのメンバーは平均寿命が4年増加したと報告した。即座の観察は、結果が薬を使用しているグループにとってより良いので、薬が実際に機能していることを示しているかもしれません。ただし、観察が偶然の発生、特に驚くべき幸運によるものである可能性もあります。 tテストは、結果が実際に正しく、母集団全体に適用できるかどうかを結論付けるのに役立ちます。

学校では、クラスAの100人の学生が平均85％を獲得し、標準偏差は3％でした。クラスBに属する別の100人の学生は、4％の標準偏差で平均87％を獲得しました。クラスBの平均はクラスAの平均よりも優れていますが、クラスBの学生の全体的なパフォーマンスがクラスAの学生のパフォーマンスよりも優れているという結論にジャンプするのは正しくない場合があります。これは、自然変動があるためです。両方のクラスのテストスコアが異なるため、違いは偶然によるものである可能性があります。 t検定は、一方のクラスがもう一方のクラスよりもうまくいったかどうかを判断するのに役立ちます。

##Tテストの仮定

tテストに関して行われる最初の仮定は、測定の規模に関するものです。 tテストの前提は、収集されたデータに適用される測定のスケールが、IQテストのスコアなどの連続的または通常のスケールに従うことです。
2番目の仮定は、単純なランダムサンプルの仮定であり、データは、総人口の代表的なランダムに選択された部分から収集されます。
3番目の仮定は、データをプロットすると、正規分布のベル型の分布曲線になるというものです。

1.最後の仮定は、分散の均一性です。サンプルの標準偏差がほぼ等しい場合、均一または等しい分散が存在します。

##Tテストの計算

t検定の計算には、3つの主要なデータ値が必要です。これらには、各データセットの平均値の差（平均差と呼ばれます）、各グループの標準偏差、および各グループのデータ値の数が含まれます。

tテストの結果はt値を生成します。次に、この計算されたt値は、臨界値テーブル（T分布テーブルと呼ばれる）から取得された値と比較されます。この比較は、差に対する偶然の影響のみ、および差がその偶然の範囲外であるかどうかを判断するのに役立ちます。 t検定は、グループ間の差が研究の真の差を表すのか、それとも意味のないランダムな差である可能性があるのかを質問します。

###T-分布表

T分布表は、片側および両側の形式で使用できます。前者は、明確な方向（正または負）の固定値または範囲を持つケースを評価するために使用されます。たとえば、サイコロを振ったときに出力値が-3未満のままになる確率、または7を超える確率はどれくらいですか？後者は、座標が-2と+2の間にあるかどうかを尋ねるなど、範囲境界分析に使用されます。

計算は、MSExcelにあるような必要な統計機能をサポートする標準のソフトウェアプログラムを使用して実行できます。

###T値と自由度

tテストは、出力として2つの値を生成します。t値と自由度です。 t値は、2つのサンプルセットの平均とサンプルセット内に存在する変動との差の比率です。分子値（2つのサンプルセットの平均の差）は簡単に計算できますが、分母（サンプルセット内に存在する変動）は、関連するデータ値のタイプによっては少し複雑になる可能性があります。比率の分母は、分散または変動性の測定値です。 tスコアとも呼ばれるt値の値が高い場合は、2つのサンプルセット間に大きな違いがあることを示しています。 t値が小さいほど、2つのサンプルセット間に類似性があります。

-大きなtスコアは、グループが異なることを示します。

-小さなTスコアは、グループが類似していることを示します。

自由度とは、変化する自由があり、ヌル仮説の重要性と妥当性を評価するために不可欠な研究の値を指します。これらの値の計算は通常、サンプルセットで使用可能なデータレコードの数に依存します。

##相関（または対応のある）T検定

相関tテストは、サンプルが通常、類似したユニットの一致するペアで構成されている場合、または測定が繰り返される場合に実行されます。たとえば、特定の治療を受ける前後に、同じ患者が繰り返し検査される場合があります。このような場合、各患者は自分自身に対する対照サンプルとして使用されています。

この方法は、サンプルが何らかの形で関連している場合や、子供、親、兄弟を含む比較分析のように、一致する特性を持っている場合にも適用されます。相関またはペアのtテストは、2セットのサンプルが関連している場合を含むため、依存型です。

ペアのtテストのt値と自由度を計算するための式は次のとおりです。

$\ begin ＆amp; \ text = \ frac {\ frac {（n1-1）\ times var1 ^ 2 +（n2-1） \ times var2 ^ 2} {n1 + n2-2} \ times \ sqrt {\ frac {1} + \ frac {1} }} \＆amp; \ textbf {where：} \＆amp ; mean1 \text{および}mean2= \ text{各サンプルの平均値}\＆amp; \ text{サンプルセットの}\＆amp; var1 \text{および}var2= \text{各サンプルの差異設定s} \＆amp; n1 \text{および}n2= \text{各サンプルセットのレコード数}\end </ annotation> </ semantics> </ math> </スパン><スパンクラス="m ord "> T-value = n 1 + n 2 − 2 （ n 1 − 1 ） ×<spanclass = "mord mathnormal mtight" style = "margin-right：0.03588 em; "> v a r 1 2 + （ n 2 − 1 ） × v a r 2 2 <spanclass="mbin">×<spanclass =" mspace "style =" margin-right：0.2222222222222222em; "> n 1 1 + n 2 </ spa n> 1 <svg width = '400em' height = '1.8800000000000001em' viewBox = '0 0 400000 1944'preserveAspectRatio='xMinYMinスライス'><pathd ='M983 90 l0 -0 c4、-6.7、10、-10、18、-10 H400000v40 H1013.1s-83.4,268、-264.1,840c-180.7,572、-277,876.3、-289,913c-4.7,4.7、-12.7,7、-24,7 s-12,0、-12,0c-1.3、-3.3、-3.7、-11.7、-7、-25c-35.3、-125.3、-106.7、-373.3、-214、-744 c-10,12、-21,25、-33,39s-32,39、-32,39c-6、-5.3、-15、-14、-27、-26s25、-30,25、-30 c26.7、-32.7,52、-63,76、-91s52、-60,52、-60s208,722,208,722 c56、-175.3、126.3、-397.3、211、-666c84.7、-268.7、153.8、-488.2、207.5、-658.5 c53.7、-170.3、84.5、-266.8、92.5、-289.5z M1001 80h400000v40h-400000z'/> </ svg> m e a n 1 − m e a n 2 場所： m e a n 1 および m e a n 2 = <spanclass="mord">それぞれの平均値 <spanstyle =" top：-1.80572em; "> サンプルセットの<spanclass="mord"> v a r 1 <spanclass="mord">および v a r 2 = <spanclass="mord">各サンプルセットのバリエーション <spanstyle = "top：1.19428em;"> n 1 <spanclass="mord">および n 2 = <spanclass="mord">各サンプルセットのレコード数 </スパン> 1 と、 <mtable rowspacing = "0.24999999999999992em "columnalign =" right left "columnspacing =" 0em "> <mstyle scriptlevel =" 0 "displaystyle =" true "> </ mrow> </ mstyle> </ mtd> 自由度 = </ mo> n </ mi> < mn> 1 </ mn> + </ mo> n </ mi> 2 </ mn> − </ mo> 2 </ mn> </ mrow > </ mstyle> </ mtd> </ mtr> </ mrow> </ mstyle> </ mtd> </ mrow> 場所：</ mtext> </ mrow> </ mstyle> </ mtd> < / mtr> </ mrow> </ mstyle> </ mtd> </ mrow> n </ mi> 1 および n </ mi> 2 < / mn> = 各サンプルセットのレコード数</ mrow> </ mstyle> </ mtd> </ m tr> </ mtable> \ begin ＆amp; \ text = n1 + n2-2 \＆amp; \ textbf {where：} \ ＆amp; n1 \text{および}n2= \text{各サンプルセットのレコード数}\\ end </ annotation> </ semantics> </ math> <spanclass="mord">自由度 <spanclass = "mspace" style = "margin-right：0.2777777777777778em;"> = n 1 + n 2 − 2 場所： n 1 <spanclass="mord">および n 2 = <spanclass="mord">各レコードの数サンプルセット <スパンクラスs = "vlist" style = "height：2.000000000000001em;"> 1 ##不等分散Tテスト不等分散tテストは、各グループのサンプル数が異なり、2つのデータセットの分散も異なる場合に使用されます。このテストは、ウェルチのtテストとも呼ばれます。次の式は、不等分散tテストのt値と自由度の計算に使用されます。 <mtable rowspacing = "0.24999999999999992em "columnalign =" right left "columnspacing =" 0em "> <mstyle scriptlevel =" 0 "displaystyle =" true "> </ mrow> </ mstyle> </ mtd> </ mrow> T-value </ mtext> = </ mo> m </ mi> e </ mi> a </ mi> n </ mi> 1 </ mn> − </ mo> m < / mi> e </ mi> a </ mi> n </ mi> 2 </ mn> </ mrow> <mofence = " false ">（</ mo> v </ mi> a </ mi> r </ mi> 1 </ mn> </ mrow> n </ mi> 1 </ mn> </ mrow> </ mfrac> + </ mo> v </ mi> a </ mi> r </ mi> 2 </ mn> </ mrow> n </ mi> 2 </ mn> < / mrow> </ mfrac> <mothence = "false">）</ mo> </ mrow> </ mrow> </ msqrt> </ mfrac> </ mrow> </ mstyle> </ mtd> </ mtr> </ mrow> </ mstyle> </ mtd> </ mrow> 場所：</ mtext> </ mrow> </ mstyle> </ mtd> </ mtr> </ mrow> </ mstyle> </ mtd> </ mrow> m </ mi> e </ mi> a </ mi> n </ mi> 1 および m </ mi> e </ mi> a </ mi> n </ mi> 2 </ mn> = 各の平均値</ mrow> < / mstyle> </ mtd> </ mtr> </ mrow> </ mstyle> </ mtd> サンプルセット</ mrow> </ mstyle> </ mtd> </ mtr> </ mrow> </ mstyle> </ mtd> </ mrow> v </ mi> a </ mi> r </ mi> 1 および v </ mi> a </ mi> r </ mi> 2 </ mn> = 各サンプルセットの差異</ mtext> </ mrow> </ mstyle> </ mtd> </ mtr> </ mrow> </ mstyle> </ mtd> </ mrow> n </ mi> 1 および n </ mi> 2 </ mn> = 数各サンプルセットのレコード</ mrow> </ mstyle> </ mtd> </ mtr> </ mtable> \ begin ＆amp; \ text {T値}=\ frac {\ sqrt {\ bigg（\ frac {+ \ frac \ bigg）}}} \＆amp; \ textbf {ここで：} \＆amp; mean1 \text{および}mean2= \ text{各の平均値}\＆amp; \ text{サンプルセットの}\＆amp; var1 \text{および}var2= \ text {各サンプルセットの差異}\＆amp; n1 \text{および}n2= \text{各サンプルセットのレコード数}\end </ annotation> </ semantics> </ math> T値 = （ n 1 v a r 1 + n 2 v a r 2 ） <svg width = '400em' height = '3.08em' viewBox = ' 0 0 400000 3240'preserveAspectRatio='xMinYMinスライス'><パスd='M473,2793 c339.3、-1799.3、509.3、-2700、510、-2702 l0 -0 c3.3、-7.3、9.3、-11、18、-11 H400000v40H1017.7 s-90.5,478、-276.2,1466c-185.7,988、-279.5,1483、-281.5,1485c-2,6、-10,9、-24,9 c-8,0、-12、-0.7、-12、-2c0、-1.3、-5.3、-32、-16、-92c-50.7、-293.3、-119.7、-693.3、-207、-1200 c0、-1.3、-5.3,8.7、-16,30c-10.7,21.3、-21.3,42.7、-32,64s-16,33、-16,33s-26、-26、-26、-26 s76、-153,76、-153s77、-151,77、-151c0.7,0.7,35.7,202,105,604c67.3,400.7,102,602.7,104、 606zM1001 80h400000v40H1017.7z'/> </ svg> m e a n 1 − m e a n 2 <spanclass = "mordtextbf">場所： m e a n 1 および m e a n 2 = <spanclass="mord">それぞれの平均値 <spanclass="mord">サンプルセット <spanstyle = " top：0.29427999999999965em; "> v a r 1 および v a r 2 = <spanclass="mord">各サンプルセットのバリエーション <spanstyle = "top：1.7942799999999997 em; "> n 1 <spanclass="mord">および n 2 = 各サンプルセットのレコード数 と、 <mtable rowspacing = "0.24999999999999992em "columnalign =" right left "columnspacing =" 0em "> <mstyle scriptlevel =" 0 "displaystyle =" true "> </ mrow> </ mstyle> </ mtd> 自由度 = </ mo> <mothence = "true">（</ mo> v </ mi> a </ mi> r </ mi> 1 </ mn> 2 </ mn> </ msup> </ mrow> n </ mi> 1 </ mn> </ mrow> </ mfrac> + </ mo> v </ mi> a </ mi> r </ mi> 2 </ mn> 2 </ mn> </ msup> </ mrow> n </ mi> 2 </ mn> </ mrow> </ mfrac> <mothence = "true">）</ mo> </ mrow> 2 </ mn> </ msup> <mothence = "true">（</ mo> < mi> v </ mi> a </ mi> r </ mi> 1 </ mn> 2 </ mn> </ msup> </ mrow> n </ mi> 1 </ mn> </ mrow> </ mfrac> <mothence = "true">）</ mo> </ mrow> 2 </ mn> </ msup> n </ mi> 1 </ mn> − </ mo> 1 </ mn> </ mrow> </ mfrac> + </ mo> <mothence = "true">（</ mo> v </ mi> a </ mi> r </ mi> 2 </ mn> 2 </ mn> </ msup> </ mrow> n </ mi> 2 </ mn> </ mrow> </ mfrac> <mothence = "true">）</ mo> </ mrow> 2 </ mn> </ msup > n </ mi> 2 </ mn> − </ mo> 1 </ mn> </ mrow> </ mfrac> </ mrow> </ mfrac> </ mrow> </ mstyle> </ mtd> </ mtr> </ mrow> </ mstyle> </ mtd> </ mrow> ここで：</ mtext> </ mrow> </ mstyle> </ mtd> </ mtr> </ mrow> </ mstyle> </ mtd> <mstyle scriptlevel = " 0 "displaystyle =" true "> </ mrow> v </ mi> a </ mi> r </ mi> 1 </ mn> および v </ mi> a </ mi> r </ mi> 2 </ mn> = </ mo> 各サンプルセットのバリエーション</ mrow> </ mstyle> </ mtd> </ mtr> </ mrow> </ mstyle> </ mtd> </ mrow> n </ mi> 1 および n < / mi> 2 </ mn> = 各サンプルセットのレコード数</ mrow> </ mstyle> </ mtd> </ mtr> < / mtable> \ begin ＆amp; \ text = \ frac {\ left（\ frac {var1 ^ 2} + \ frac { var2 ^ 2} \ right）^ 2} {\ frac {\ left（\ frac {var1 ^ 2} \ right）^ 2} + \ frac {\ left（\ frac {var2 ^ 2} \ right）^ 2} {n2 --1}} \＆amp; \ textbf {where：} \＆amp; var1 \text{および}var2= \text{各サンプルセット}\＆amp; n1 \text{および}n2= \text{各サンプルセットのレコード数}\\ end </ annotation> </ semantics> </ math> </ sp an> <spanclass="mord">自由度 <spanclass = "mspace" style = "margin-right：0.2777777777777778em;"> = n 1 − 1 （ n 1 v a r 1 2 ） 2 + n 2 − 1 （ n 2 v a r 2 2 ） 2 （ n 1 v a r 1 2 + n 2 v a r 2 2 ） 2 ここで： v a r 1 <spanclass="mord">および v a r 2 = <spanclass="mord">各サンプルセットのバリエーション <spanstyle = "top：- 0.7677335000000003em; "> n 1 <spanclass="mord">および n 2 = 各サンプルセットのレコード数 </スパン> ##使用する正しいT検定の決定次のフローチャートを使用して、サンプルセットの特性に基づいてどのt検定を使用するかを決定できます。考慮すべき重要な項目には、サンプルレコードが類似しているかどうか、各サンプルセットのデータレコードの数、および各サンプルセットの差異が含まれます。 <！-542FF1003D06AE1BEB3761D058530C08-> ##不等分散Tテストの例アートギャラリーで受け取った絵画の対角線の測定を行っていると仮定します。サンプルの1つのグループには10枚の絵画が含まれ、もう1つのグループには20枚の絵画が含まれています。対応する平均値と分散値を持つデータセットは次のとおりです。 TTT セット2の平均はセット1の平均よりも高いですが、セット2に対応する母集団がセット1に対応する母集団よりも高い平均を持っていると結論付けることはできません。アートギャラリーで受け取ったすべての絵画の全体的な人口に本当に違いがありますか？ 2つのサンプルセット間で平均が同じであるというヌル仮説を仮定して問題を確立し、tテストを実行して仮説が妥当かどうかをテストします。データレコードの数が異なり（n1=10とn2=20）、分散も異なるため、上記のデータセットのt値と自由度は、不等分散Tテストで説明した式を使用して計算されます。セクション。 t値は-2.24787です。 2つのt値を比較する場合、マイナス記号は無視できるため、計算値は2.24787です。自由度の値は24.38であり、値を可能な限り最小の整数値に切り捨てる必要がある式の定義により、24に減少します。受け入れの基準として、確率のレベル（アルファレベル、重要度のレベル、** p **）を指定できます。ほとんどの場合、5％の値を想定できます。自由度の値を24、有意水準を5％として使用すると、t値の分布表を見ると2.064の値が得られます。この値を計算値2.247と比較すると、計算されたt値が5％の有意水準でテーブル値よりも大きいことがわかります。したがって、平均間に差がないという帰無仮説を棄却するのは安全です。人口セットには本質的な違いがあり、偶然ではありません。 ##ハイライト -tテストは、特定の機能に関連している可能性のある2つのグループの平均値に有意差があるかどうかを判断するために使用される一種の推論統計です。、統計での仮説テストの目的で使用される多くのテストの1つです。 -必要なデータと分析のタイプに応じて実行できるtテストにはいくつかの異なるタイプがあります。 -tテストの計算には、3つの主要なデータ値が必要です。これらには、各データセットの平均値の差（平均差と呼ばれます）、各グループの標準偏差、および各グループのデータ値の数が含まれます。 Stock Insights | iOS & Android Investing ideas and signals aggregator (adsbygoogle = window.adsbygoogle || []).push({}); (adsbygoogle = window.adsbygoogle || []).push({}); (adsbygoogle = window.adsbygoogle || []).push({}); Disclaimer Terms of Use Privacy Policy Cookie Policy September 16, 2023, 20:10$