Investor's wiki

T-Test

T-Test

Was ist ein T-Test?

Ein t-Test ist eine Art Inferenzstatistik , die verwendet wird, um festzustellen, ob es einen signifikanten Unterschied zwischen den Mittelwerten zweier Gruppen gibt, die in bestimmten Merkmalen verwandt sein können. Es wird hauptsächlich verwendet, wenn die Datensätze, wie der Datensatz, der als Ergebnis eines 100-maligen Werfens einer Münze aufgezeichnet wird, einer Normalverteilung folgen würden und unbekannte Abweichungen aufweisen könnten. Ein t-Test wird als Hypothesentestwerkzeug verwendet, das das Testen einer Annahme ermöglicht, die auf eine Population anwendbar ist.

Ein t-Test untersucht die t-Statistik, die t-Verteilungswerte und die Freiheitsgrade, um die statistische Signifikanz zu bestimmen. Um einen Test mit drei oder mehr Mittelwerten durchzuführen, muss man eine Varianzanalyse verwenden.

Erklärung des T-Tests

Im Wesentlichen ermöglicht uns ein t-Test, die Durchschnittswerte der beiden Datensätze zu vergleichen und festzustellen, ob sie aus derselben Population stammen. Wenn wir in den obigen Beispielen eine Stichprobe von Schülern aus Klasse A und eine andere Stichprobe von Schülern aus Klasse B nehmen würden, würden wir nicht erwarten, dass sie genau denselben Mittelwert und dieselbe Standardabweichung aufweisen. In ähnlicher Weise sollten Proben, die der mit Placebo gefütterten Kontrollgruppe entnommen wurden, und jene, die der Gruppe mit verschriebenem Medikament entnommen wurden, einen leicht unterschiedlichen Mittelwert und eine leicht unterschiedliche Standardabweichung aufweisen.

Mathematisch nimmt der t-Test eine Stichprobe aus jeder der beiden Mengen und erstellt die Problemstellung, indem er eine Nullhypothese annimmt, dass die beiden Mittelwerte gleich sind. Basierend auf den anwendbaren Formeln werden bestimmte Werte berechnet und mit den Standardwerten verglichen und die angenommene Nullhypothese entsprechend akzeptiert oder verworfen.

Wenn die Nullhypothese zurückgewiesen werden kann, weist dies darauf hin, dass die Datenwerte stark und wahrscheinlich nicht zufällig sind.

Der t-Test ist nur einer von vielen Tests, die für diesen Zweck verwendet werden. Statistiker müssen zusätzlich andere Tests als den t-Test verwenden, um mehr Variablen und Tests mit größeren Stichprobenumfängen zu untersuchen. Bei großen Stichproben verwenden Statistiker einen z-Test. Weitere Testmöglichkeiten sind der Chi-Quadrat-Test und der F-Test.

Es gibt drei Arten von t-Tests, und sie werden als abhängige und unabhängige t-Tests kategorisiert.

Mehrdeutige Testergebnisse

Stellen Sie sich vor, ein Arzneimittelhersteller möchte ein neu erfundenes Medikament testen. Es folgt dem Standardverfahren, das Medikament an einer Gruppe von Patienten auszuprobieren und einer anderen Gruppe, der sogenannten Kontrollgruppe, ein Placebo zu verabreichen. Das Placebo, das der Kontrollgruppe verabreicht wird, ist eine Substanz ohne beabsichtigten therapeutischen Wert und dient als Maßstab, um zu messen, wie die andere Gruppe, die das eigentliche Medikament erhält, anspricht.

Nach der Arzneimittelstudie berichteten die Mitglieder der Placebo-ernährten Kontrollgruppe von einer Erhöhung der durchschnittlichen Lebenserwartung von drei Jahren, während die Mitglieder der Gruppe, denen das neue Medikament verschrieben wurde, von einer Erhöhung der durchschnittlichen Lebenserwartung von vier Jahren berichteten. Eine sofortige Beobachtung kann darauf hindeuten, dass das Medikament tatsächlich wirkt, da die Ergebnisse für die Gruppe, die das Medikament verwendet, besser sind. Es ist aber auch möglich, dass die Beobachtung auf einen zufälligen Vorfall, insbesondere einen überraschenden Glücksfall, zurückzuführen ist. Ein t-Test ist nützlich, um festzustellen, ob die Ergebnisse tatsächlich korrekt und auf die gesamte Bevölkerung anwendbar sind.

In einer Schule erzielten 100 Schüler der Klasse A im Durchschnitt 85 % mit einer Standardabweichung von 3 %. Weitere 100 Schüler der Klasse B erreichten im Durchschnitt 87 % bei einer Standardabweichung von 4 %. Während der Durchschnitt von Klasse B besser ist als der von Klasse A, ist es möglicherweise nicht richtig, den Schluss zu ziehen, dass die Gesamtleistung der Schüler der Klasse B besser ist als die der Schüler der Klasse A. Dies liegt daran, dass es natürliche Schwankungen gibt in den Testergebnissen in beiden Klassen, so dass der Unterschied allein auf Zufall zurückzuführen sein könnte. Ein t-Test kann dabei helfen festzustellen, ob eine Klasse besser abgeschnitten hat als die andere.

T-Test-Annahmen

  1. Die erste Annahme bezüglich t-Tests betrifft die Messskala. Die Annahme für einen t-Test ist, dass die auf die gesammelten Daten angewendete Messskala einer kontinuierlichen oder ordinalen Skala folgt, wie z. B. die Ergebnisse für einen IQ-Test.

  2. Die zweite getroffene Annahme ist die einer einfachen Zufallsstichprobe, dass die Daten von einem repräsentativen, zufällig ausgewählten Teil der Gesamtbevölkerung erhoben werden.

  3. Die dritte Annahme ist, dass die Daten, wenn sie aufgetragen werden, zu einer normalverteilten, glockenförmigen Verteilungskurve führen.

  4. Die letzte Annahme ist die Homogenität der Varianz. Eine homogene oder gleiche Varianz liegt vor, wenn die Standardabweichungen der Stichproben ungefähr gleich sind.

Berechnung von T-Tests

Die Berechnung eines t-Tests erfordert drei Schlüsseldatenwerte. Sie umfassen die Differenz zwischen den Mittelwerten aus jedem Datensatz (als Mittelwertdifferenz bezeichnet), die Standardabweichung jeder Gruppe und die Anzahl der Datenwerte jeder Gruppe.

Das Ergebnis des t-Tests ergibt den t-Wert. Dieser berechnete t-Wert wird dann mit einem Wert verglichen, der aus einer Tabelle mit kritischen Werten (als T-Verteilungstabelle bezeichnet) stammt. Dieser Vergleich hilft dabei, die Auswirkung des Zufalls allein auf die Differenz zu bestimmen und festzustellen, ob die Differenz außerhalb dieses Zufallsbereichs liegt. Der t-Test fragt, ob der Unterschied zwischen den Gruppen einen echten Unterschied in der Studie darstellt oder ob es sich möglicherweise um einen bedeutungslosen zufälligen Unterschied handelt.

T-Verteilungstabellen

Der T-Verteilertisch ist in einseitigem und zweiseitigem Format erhältlich. Ersteres wird zur Bewertung von Fällen verwendet, die einen festen Wert oder Bereich mit einer klaren Richtung (positiv oder negativ) haben. Wie groß ist beispielsweise die Wahrscheinlichkeit, dass der Ausgabewert unter -3 bleibt oder beim Würfeln mehr als sieben ergibt? Letzteres wird für die Bereichsgrenzenanalyse verwendet, z. B. um zu fragen, ob die Koordinaten zwischen -2 und +2 liegen.

Die Berechnungen können mit Standard-Softwareprogrammen durchgeführt werden, die die notwendigen Statistikfunktionen unterstützen, wie sie beispielsweise in MS Excel zu finden sind.

T-Werte und Freiheitsgrade

Der t-Test erzeugt als Ausgabe zwei Werte: t-Wert und Freiheitsgrade. Der t-Wert ist ein Verhältnis der Differenz zwischen dem Mittelwert der beiden Stichprobensätze und der Variation, die innerhalb der Stichprobensätze vorhanden ist. Während der Zählerwert (die Differenz zwischen dem Mittelwert der beiden Stichprobensätze) einfach zu berechnen ist, kann der Nenner (die innerhalb der Stichprobensätze vorhandene Variation) je nach Art der betroffenen Datenwerte etwas kompliziert werden. Der Nenner des Verhältnisses ist ein Maß für die Streuung oder Variabilität. Höhere Werte des t-Werts, auch t-Score genannt, weisen darauf hin, dass zwischen den beiden Stichprobensätzen ein großer Unterschied besteht. Je kleiner der t-Wert, desto mehr Ähnlichkeit besteht zwischen den beiden Stichprobensätzen.

  • Ein großer t-Wert zeigt an, dass die Gruppen unterschiedlich sind.

  • Ein kleiner t-Wert zeigt an, dass die Gruppen ähnlich sind.

Freiheitsgrade beziehen sich auf die Werte in einer Studie, die die Freiheit haben, zu variieren, und die für die Beurteilung der Bedeutung und Gültigkeit der Nullhypothese wesentlich sind. Die Berechnung dieser Werte hängt normalerweise von der Anzahl der im Stichprobensatz verfügbaren Datensätze ab.

Korrelierter (oder gepaarter) T-Test

Der korrelierte t-Test wird durchgeführt, wenn die Stichproben typischerweise aus übereinstimmenden Paaren ähnlicher Einheiten bestehen oder wenn es Fälle von wiederholten Messungen gibt. Beispielsweise kann es Fälle geben, in denen dieselben Patienten wiederholt getestet werden – vor und nach Erhalt einer bestimmten Behandlung. In solchen Fällen wird jeder Patient als Kontrollprobe gegen sich selbst verwendet.

Diese Methode gilt auch für Fälle, in denen die Proben in irgendeiner Weise verwandt sind oder übereinstimmende Merkmale aufweisen, wie z. B. eine vergleichende Analyse unter Einbeziehung von Kindern, Eltern oder Geschwistern. Korrelierte oder gepaarte t-Tests sind von einem abhängigen Typ, da es sich um Fälle handelt, in denen die beiden Stichprobensätze verwandt sind.

Die Formel zur Berechnung des t-Werts und der Freiheitsgrade für einen gepaarten t-Test lautet:

T=Mittelwert1Mittelwert2< mfrac>s(diff)(n)< /mfrac>< /mstyle>wobei:Mittel1 und Mittel2=</ mo>Die Durchschnittswerte der einzelnen Probensätzes</ mi>(diff)=Die Standardabweichung der Unterschiede der gepaarten Datenwerte n= Die Stichprobengröße (die Anzahl der gepaarten Unterschiede)</mr ow>n−</ mo>1=Die Freiheitsgrade< Anmerkung encoding="application/x-tex">\begin&T=\frac{\textit1 - \textit2}{\frac{s(\text)} {\sqrt{(n)}}}\&\textbf\&\textit1\text\textit2=\text{Die jeweiligen Durchschnittswerte der Stichprobensätze}\&s(\text)=\text\&n=\text{Die Stichprobengröße (die Anzahl der gepaarten Unterschiede)}\&n-1=\text\end<span class="katex-html" aria -hidden="true">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="mord"><span-Klasse ="vlist" style="height:5.175520000000001em;">< Spanne class="vlist-t vlist-t2">T=< /span><span-Klasse ="mfrac">(n)<span-Stil ="top:-3.0089107142857143em;"><path d='M95,702

c-2.7,0,-7.17,-2.7,-13.5,-8c-5.8,-5.3,-9.5,-10,-9.5,-14

c0,-2,0,3,-3,3,1,-4c1,3,-2,7,23,83,-20,7,67,5,-54

c44.2,-33.3,65.8,-50.3,66.5,-51c1.3,-1.3,3,-2,5,-2c4.7,0,8.7,3.3,12,10

s173,378,173,378c0,7,0,35,3,-71,104,-213c68,7,-142,137,5,-285,206,5,-429

c69,-144,104,5,-217,7,106,5,-221

l0 -0

c5.3,-9.3,12,-14,20,-14

H400000v40H845.2724

s-225.272.467,-225.272.467s-235.486,-235.486c-2.7,4.7,-9,7,-19,7

c-6,0,-10,-1,-12,-3s-194,-422,-194,-422s-65,47,-65,47z

M834 80h400000v40h-400000z'/> s(</ span>diff)</ span> </ span>Mittelwert1Mittelwert2< span class="vlist-s"></ span><span-Klasse ="mord text">wo:< /span>gemein 1 und Mittelwert2</ span>=Die Durchschnittswerte der einzelnen Probensätzes(diff )=Die Standardabweichung der Differenzen der gepaarten Datenwerte n< span class="mrel">=Die Stichprobengröße (die Anzahl der gepaarten Unterschiede)n1=Die Freiheitsgrade

Die verbleibenden zwei Typen gehören zu den unabhängigen t-Tests. Die Stichproben dieser Typen werden unabhängig voneinander ausgewählt, das heißt, die Datensätze in den beiden Gruppen beziehen sich nicht auf dieselben Werte. Dazu gehören Fälle wie eine Gruppe von 100 Patienten, die in zwei Gruppen von jeweils 50 Patienten aufgeteilt wird. Eine der Gruppen wird zur Kontrollgruppe und erhält ein Placebo, während die andere Gruppe die vorgeschriebene Behandlung erhält. Dies stellt zwei unabhängige Probengruppen dar, die nicht miteinander gepaart sind.

Gleicher Varianz- (oder gepoolter) T-Test

Der t-Test auf gleiche Varianz wird verwendet, wenn die Anzahl der Stichproben in jeder Gruppe gleich ist oder die Varianz der beiden Datensätze ähnlich ist. Die folgende Formel wird zur Berechnung des t-Werts und der Freiheitsgrade für den t-Test bei gleicher Varianz verwendet:

T-Wert= mean1m< /mi>ean2(n11)×var1< mn>2+(n21)×var22n 1+n22< /mfrac>×1n1+1< /mn>n2 < mstyle scriptlevel="0" displaystyle="true">wobei:</ mtr>mean1</ mn> und mean2 =Durchschnittswerte von jedemder Mustersätzev</ mi>ar1 und va r2=Varianz der einzelnen Stichprobensätze n1 und n2 =Anzahl der Datensätze in jedem Beispielsatz\begin&\text = \frac{ mean1 - mean2 }{\frac {(n1 - 1) \times var12 + (n2 - 1) \times var22 }{ n1 +n2 - 2}\times \sqrt{ \frac{1} + \frac{1}} } \&\textbf\&amp ;Mittelwert1 \text Mittelwert2 = \text \&\text{der Stichprobensätze}\&var1 \text var2 = \text\&n1 \text n2 = \text{Anzahl der Datensätze in jedem Stichprobensatz} \end

l0 -0

c4,-6.7,10,-10,18,-10 H400000v40

H1013.1s-83.4.268,-264.1.840c-180.7.572,-277.876.3,-289.913c-4.7,4.7,-12.7,7,-24,7

s-12,0,-12,0c-1.3,-3.3,-3.7,-11.7,-7,-25c-35.3,-125.3,-106.7,-373.3,-214,-744

c-10,12,-21,25,-33,39s-32,39,-32,39c-6,-5.3,-15,-14,-27,-26s25,-30,25,-30

c26.7,-32.7,52,-63,76,-91s52,-60,52,-60s208.722.208.722

c56,-175,3,126,3,-397,3,211,-666c84,7,-268,7,153,8,-488,2,207,5,-658,5

c53.7,-170.3,84.5,-266.8,92.5,-289.5z

M1001 80h400000v40h-400000z'/> < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">m< span class="mord mathnormal">ean2<span-Klasse ="mord">wobei:< /span>mea< span class="mord mathnormal">n1 und </ span>mean2< span class="mspace" style="margin-right:0.27777777777777778em;">=Durchschnittswerte von jedem< span class="mord text">der Mustersätze< span class="pstrut" style="height:3.32144em;">var 1 und var2= Varianz jedes Stichprobensatzesn1 und n2= Anzahl der Datensätze in jedem Stichprobensatz</ span>

und,

Freiheitsgrade=n< mn>1+n22 wobei:< /mtr>n1 und n2< /mn>=Anzahl der Datensätze in jedem Stichprobensatz</m tr>\begin &\text = n1 + n2 - 2 \ &\textbf\ &n1 \text n2 = \text{Anzahl der Datensätze in jedem Stichprobensatz} \ \end

Ungleicher Varianz-T-Test

Der t-Test auf ungleiche Varianz wird verwendet, wenn die Anzahl der Stichproben in jeder Gruppe unterschiedlich ist und die Varianz der beiden Datensätze ebenfalls unterschiedlich ist. Dieser Test wird auch t-Test nach Welch genannt. Die folgende Formel wird zur Berechnung des t-Werts und der Freiheitsgrade für einen t-Test mit ungleicher Varianz verwendet:

T-Wert= mean1m< /mi>ean2(var1 n1+v</ mi>ar2n2< /mrow>)</ mtr>wobei: me an1 und me</ mi>an2=Durchschnittswerte von jedem< /mstyle>der Mustersätzevar1 und var2=Varianz der einzelnen Stichprobensätze</ mtext> n1 und n2=Anzahl von Aufzeichnungen in jedem Probensatz\begin&\text =\frac{\sqrt{\bigg(\frac{+\frac\bigg)}}}\&\textbf \&mean1 \text mean2 = \text{Average values ​​of each} \&\text \&var1 \text var2 = \text \&n1 \text n2 = \text{Anzahl der Datensätze in jedem Stichprobensatz} \end< /span>T-Wert< /span>=< span class="vlist-r">( n1 var 1 < /span>+< span class="mfrac">n2< /span>var2 )<path d='M473,2793

c339,3,-1799,3,509,3,-2700,510,-2702 l0 -0

c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7

s-90.5,478,-276.2,1466c-185.7,988,-279.5,1483,-281.5,1485c-2,6,-10,9,-24,9

c-8,0,-12,-0.7,-12,-2c0,-1.3,-5.3,-32,-16,-92c-50.7,-293.3,-119.7,-693.3,-207,-1200

c0,-1.3,-5.3,8.7,-16,30c-10.7,21.3,-21.3,42.7,-32,64s-16,33,-16,33s-26,-26,-26,-26

s76,-153,76,-153s77,-151,77,-151c0,7,0,7,35,7,202,105,604c67,3,400,7,102,602,7,104,

606zM1001 80h400000v40H1017.7z'/> < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">m< span class="mord mathnormal">ean2< span class="vlist" style="height:2.93em;"></ span>wobei: mea n1 und < /span>mean2=Durchschnittswerte von jedem der Mustersetsvar1 und v ar2=</ span>Varianz jedes Stichprobensatzesn1 und n2=Anzahl der Datensätze in jedem Stichprobensatz

und,

Freiheitsgrade= (var1 2n1 +var22 n2)</ mo>2(< mi>var12 n1)2</ mn>n11 +(v</ mi>ar22n2)2n21</ mfrac></ mtd>wobei: var1 und var2=Varianz der einzelnen Beispielsätze n1 und n< /mi>2=Anzahl der Datensätze in jedem Probensatz< /mtable>\begin &\text = \frac{ \left ( \frac{ var12 } + \frac{ var22 } \right )2 }{ \frac{ \left ( \frac{ var12 } \right )2 }{ n1 - 1 } + \frac{ \left ( \frac { var22 } \right )^2 }{ n2 - 1}} \ &\textbf\ &var1 \text var2 = \text{Varianz von jedem der Beispielsätze} \ &n1 \text n2 = \text{Anzahl der Datensätze in jedem Beispielsatz} \ \end< span class="katex-html" aria-hidden="true">< /span><span-Klasse ="vlist-t vlist-t2"> </sp an>Freiheitsgrade< /span>= </ span>n1< /span>1< /span><span-Klasse ="pstrut" style="height:3em;">( n1 < span class="pstrut" style="height:3em;">var1< span class="vlist-r">2)2</ span></ span>+<span-Klasse ="sizing reset-size6 size3 mtight">n21</ span>(< span class="mord mtight">n2< /span>var< /span>22 < /span>) 2< /span> <span class="pstrut"-Stil ="height:3.58523em;">(n1var1< span class="vlist-r">2</ span>​< /span>< /span><span-Klasse ="mbin">+ n2< /span> v</ span>ar2</ span>2 )2 wobei:var< span class="mord">1 und var</ span>2=</ span>Varianz jedes Stichprobensatzesn1 und < span class="mord mathnormal">n2< span class="mrel">=Anzahl der Datensätze in jedem Stichprobensatz</ span>

Bestimmung des korrekten zu verwendenden T-Tests

Das folgende Flussdiagramm kann verwendet werden, um zu bestimmen, welcher t-Test basierend auf den Eigenschaften der Stichprobensätze verwendet werden sollte. Zu den zu berücksichtigenden Schlüsselelementen gehören, ob die Stichprobenaufzeichnungen ähnlich sind, die Anzahl der Datensätze in jeder Stichprobenmenge und die Varianz jeder Stichprobenmenge.

T-Testbeispiel mit ungleicher Varianz

Angenommen, wir nehmen eine diagonale Messung von Gemälden vor, die wir in einer Kunstgalerie erhalten haben. Eine Probengruppe umfasst 10 Gemälde, die andere 20 Gemälde. Die Datensätze mit den entsprechenden Mittel- und Varianzwerten lauten wie folgt:

TTT

Obwohl der Mittelwert von Set 2 höher ist als der von Set 1, können wir nicht schlussfolgern, dass die Population, die Set 2 entspricht, einen höheren Mittelwert hat als die Population, die Set 1 entspricht. Ist der Unterschied von 19,4 zu 21,6 allein auf Zufall zurückzuführen, oder doch? Gibt es wirklich Unterschiede in der Gesamtpopulation aller in der Kunstgalerie eingegangenen Gemälde? Wir stellen das Problem fest, indem wir die Nullhypothese annehmen, dass der Mittelwert zwischen den beiden Stichprobensätzen gleich ist, und einen t-Test durchführen, um zu testen, ob die Hypothese plausibel ist.

Da die Anzahl der Datensätze unterschiedlich ist (n1 = 10 und n2 = 20) und auch die Varianz unterschiedlich ist, werden t-Wert und Freiheitsgrade für den obigen Datensatz mit der im T-Test auf ungleiche Varianz genannten Formel berechnet Sektion.

Der t-Wert beträgt -2,24787. Da das Minuszeichen beim Vergleich der beiden t-Werte ignoriert werden kann, beträgt der berechnete Wert 2,24787.

Der Wert der Freiheitsgrade beträgt 24,38 und reduziert sich auf 24, da die Formeldefinition eine Abrundung des Wertes auf den kleinstmöglichen ganzzahligen Wert erfordert.

Als Akzeptanzkriterium kann man ein Wahrscheinlichkeitsniveau (Alpha-Niveau, Signifikanzniveau, p) angeben. In den meisten Fällen kann von einem Wert von 5 % ausgegangen werden.

Unter Verwendung des Freiheitsgradwerts von 24 und einem Signifikanzniveau von 5 % ergibt ein Blick auf die t-Wert-Verteilungstabelle einen Wert von 2,064. Ein Vergleich dieses Werts mit dem berechneten Wert von 2,247 zeigt, dass der berechnete t-Wert bei einem Signifikanzniveau von 5 % größer ist als der Tabellenwert. Daher ist es sicher, die Nullhypothese abzulehnen, dass es keinen Unterschied zwischen Mittelwerten gibt. Die Bevölkerungsgruppe weist intrinsische Unterschiede auf, und sie sind kein Zufall.

Höhepunkte

  • Ein t-Test ist eine Art Inferenzstatistik, die verwendet wird, um festzustellen, ob es einen signifikanten Unterschied zwischen den Mittelwerten zweier Gruppen gibt, die in bestimmten Merkmalen verwandt sein können.

  • Der t-Test ist einer von vielen Tests, die zum Testen von Hypothesen in der Statistik verwendet werden.

  • Es gibt verschiedene Arten von t-Tests, die je nach Daten und Art der erforderlichen Analyse durchgeführt werden können.

  • Die Berechnung eines t-Tests erfordert drei Schlüsseldatenwerte. Sie umfassen die Differenz zwischen den Mittelwerten aus jedem Datensatz (als Mittelwertdifferenz bezeichnet), die Standardabweichung jeder Gruppe und die Anzahl der Datenwerte jeder Gruppe.