T-test

Vad är ett T-test?

Ett t-test är en typ av inferentiell statistik som används för att avgöra om det finns en signifikant skillnad mellan medelvärdena för två grupper, som kan vara relaterade i vissa egenskaper. Det används mest när datamängderna, som datauppsättningen registrerad som resultatet av att vända ett mynt 100 gånger, skulle följa en normalfördelning och kan ha okända avvikelser. Ett t-test används som ett hypotestestverktyg, vilket möjliggör testning av ett antagande som är tillämpligt på en population.

Ett t-test tittar på t-statistiken, t-fördelningsvärdena och frihetsgraderna för att bestämma den statistiska signifikansen. För att genomföra ett test med tre eller fler medel måste man använda en variansanalys.

Förklarar T-testet

I huvudsak låter ett t-test oss jämföra medelvärdena för de två datamängderna och avgöra om de kom från samma population. I exemplen ovan, om vi skulle ta ett urval av elever från klass A och ett annat urval av elever från klass B, skulle vi inte förvänta oss att de skulle ha exakt samma medelvärde och standardavvikelse. På samma sätt bör prover som tagits från den placebomatade kontrollgruppen och de som tagits från den läkemedelsförskrivna gruppen ha något annorlunda medelvärde och standardavvikelse.

Matematiskt tar t-testet ett urval från var och en av de två uppsättningarna och etablerar problemformuleringen genom att anta en nollhypotes att de två medelvärdena är lika. Baserat på tillämpliga formler beräknas och jämförs vissa värden mot standardvärdena, och den antagna nollhypotesen accepteras eller förkastas i enlighet med detta.

Om nollhypotesen kvalificerar sig för att förkastas, indikerar det att dataavläsningarna är starka och förmodligen inte beror på slumpen.

T-testet är bara ett av många test som används för detta ändamål. Statistiker måste dessutom använda andra test än t-testet för att undersöka fler variabler och tester med större urvalsstorlekar. För en stor urvalsstorlek använder statistiker ett z-test. Andra testalternativ inkluderar chi-kvadrattestet och f-testet.

Det finns tre typer av t-tester, och de kategoriseras som beroende och oberoende t-tester.

Tvetydiga testresultat

Tänk på att en läkemedelstillverkare vill testa ett nyuppfunnit läkemedel. Det följer standardproceduren att prova läkemedlet på en grupp patienter och ge placebo till en annan grupp, kallad kontrollgruppen. Placebo som ges till kontrollgruppen är en substans utan avsett terapeutiskt värde och fungerar som ett riktmärke för att mäta hur den andra gruppen, som får det faktiska läkemedlet, reagerar.

Efter läkemedelsprövningen rapporterade medlemmarna i den placebomatade kontrollgruppen en ökning av medellivslängden på tre år, medan medlemmarna i gruppen som ordineras det nya läkemedlet rapporterar en ökning av medellivslängden med fyra år. Omedelbar observation kan indikera att läkemedlet verkligen fungerar eftersom resultaten är bättre för gruppen som använder läkemedlet. Det är dock också möjligt att observationen kan bero på en tillfällighet, särskilt en överraskande tur. Ett t-test är användbart för att dra slutsatsen om resultaten faktiskt är korrekta och tillämpliga på hela populationen.

I en skola fick 100 elever i klass A i genomsnitt 85 % med en standardavvikelse på 3 %. Ytterligare 100 elever som tillhör klass B fick i genomsnitt 87 % med en standardavvikelse på 4 %. Även om medeltalet för klass B är bättre än för klass A, är det kanske inte korrekt att dra till slutsatsen att den övergripande prestationen för elever i klass B är bättre än för elever i klass A. Detta beror på att det finns naturliga variationer i testresultaten i båda klasserna, så skillnaden kan bero på enbart slumpen. Ett t-test kan hjälpa till att avgöra om en klass klarade sig bättre än den andra.

T-testantaganden

Det första antagandet som gjordes beträffande t-tester gäller mätskalan. Antagandet för ett t-test är att mätskalan som tillämpas på insamlade data följer en kontinuerlig eller ordinal skala, såsom poängen för ett IQ-test.
Det andra antagandet som görs är ett enkelt slumpmässigt urval, att data samlas in från en representativ, slumpmässigt utvald del av den totala populationen.
Det tredje antagandet är att data, när de plottas, resulterar i en normalfördelning, klockformad distributionskurva.
Det sista antagandet är variansens homogenitet. Homogen, eller lika, varians existerar när standardavvikelserna för prover är ungefär lika.

Beräknar T-test

För att beräkna ett t-test krävs tre nyckeldatavärden. De inkluderar skillnaden mellan medelvärdena från varje datamängd (kallad medelskillnad), standardavvikelsen för varje grupp och antalet datavärden för varje grupp.

Resultatet av t-testet ger t-värdet. Detta beräknade t-värde jämförs sedan mot ett värde erhållet från en kritisk värdetabell (kallad T-fördelningstabell). Denna jämförelse hjälper till att bestämma effekten av enbart slumpen på skillnaden och om skillnaden ligger utanför det chansintervallet. T-testet ifrågasätter om skillnaden mellan grupperna representerar en sann skillnad i studien eller om det möjligen är en meningslös slumpmässig skillnad.

T-fördelningstabeller

T-distributionstabellen är tillgänglig i format med en svans och två svansar. Den förra används för att bedöma fall som har ett fast värde eller intervall med en tydlig riktning (positiv eller negativ). Till exempel, vad är sannolikheten för att utmatningsvärdet förblir under -3, eller att få mer än sju när man kastar ett par tärningar? Den senare används för avståndsbunden analys, som att fråga om koordinaterna ligger mellan -2 och +2.

Beräkningarna kan utföras med standardprogram som stöder nödvändiga statistiska funktioner, som de som finns i MS Excel.

T-värden och frihetsgrader

t-testet producerar två värden som dess utdata: t-värde och frihetsgrader. t-värdet är ett förhållande mellan skillnaden mellan medelvärdet av de två provuppsättningarna och variationen som finns inom provuppsättningarna. Medan täljarvärdet (skillnaden mellan medelvärdet av de två provuppsättningarna) är enkelt att beräkna, kan nämnaren (variationen som finns inom provuppsättningarna) bli lite komplicerad beroende på vilken typ av datavärden som är involverade. Nämnaren för förhållandet är ett mått på dispersionen eller variabiliteten. Högre värden på t-värdet, även kallat t-score, indikerar att det finns en stor skillnad mellan de två provuppsättningarna. Ju mindre t-värdet är, desto mer likhet finns det mellan de två sampeluppsättningarna.

– En stor t-score indikerar att grupperna är olika.

– En liten t-score indikerar att grupperna är lika.

Frihetsgrader avser de värden i en studie som har frihet att variera och är väsentliga för att bedöma nollhypotesens betydelse och giltighet. Beräkning av dessa värden beror vanligtvis på antalet tillgängliga dataposter i provuppsättningen.

Korrelerat (eller parat) T-test

Det korrelerade t-testet utförs när proven vanligtvis består av matchade par av liknande enheter, eller när det finns fall av upprepade mätningar. Det kan till exempel finnas fall där samma patienter testas upprepade gånger – innan och efter att de fått en viss behandling. I sådana fall används varje patient som ett kontrollprov mot sig själv.

Denna metod gäller även för fall där proverna är relaterade på något sätt eller har matchande egenskaper, som en jämförande analys som involverar barn, föräldrar eller syskon. Korrelerade eller parade t-tester är av beroende typ, eftersom dessa involverar fall där de två uppsättningarna av sampel är relaterade.

Formeln för att beräkna t-värdet och frihetsgraderna för ett parat t-test är:

$\begin{aligned} T = \frac{medelvärde 1 - medelvärde 2}{< mfrac>} \\ < /mstyle> & där: \\ medelvärde 1 och medelvärde 2 </ mo>Genomsnittsvärdena för var och en av provuppsättningarna \\ s</ mi>(diff)=Standardavvikelsen av skillnaderna mellan de parade datavärdena \\ n = Samplestorleken (antalet parade skillnader) \\ </mr ow> & n -</ mo>1=Frihetsgraderna \end{aligned} < annotation encoding="application/x-tex">\begin&T=\frac{\textit1 - \textit2}{\frac{s(\text)} {\sqrt{(n)}}}\&\textbf{där:}\&\textit1\text\textit2=\text{De genomsnittliga värdena för varje av urvalsuppsättningarna}\&s(\text)=\text{Standardavvikelsen för skillnaderna mellan de parade datavärdena}\&n=\text{Samplets storlek (antalet parade skillnader)}\&n-1=\text\end$ >T=(n)<svg width='400em' height='1.5428571428571431em' viewBox='0 0 400000 1080' preserveAspectRatio='><5428571428571431em'

c-2.7,0,-7.17,-2.7,-13.5,-8c-5.8,-5.3,-9.5,-10,-9.5,-14

c0,-2,0,3,-3,3,1,-4c1,3,-2,7,23,83,-20,7,67,5,-54

c44.2,-33.3,65.8,-50.3,66.5,-51c1.3,-1.3,3,-2,5,-2c4.7,0,8.7,3.3,12,10

s173,378,173,378c0,7,0,35,3,-71,104,-213c68,7,-142,137,5,-285,206,5,-429

c69,-144,104,5,-217,7,106,5,-221

10 -0

c5.3,-9.3,12,-14,20,-14

H400000v40H845.2724

s-225.272,467,-225.272,467s-235.486,-235.486c-2.7,4.7,-9,7,-19,7

c-6,0,-10,-1,-12,-3s-194,-422,-194,-422s-65,47,-65,47z

M834 80h400000v40h-400000z'/> s(diff) mean1−mean2där:mean 1 och mean2=Genomsnittsvärdena för var och en av provuppsättningarnas(diff )=Standardavvikelsen för skillnaderna mellan de parade datavärdena n=Samplestorleken (antalet parade skillnader)n−1=Frihetsgraderna

De återstående två typerna tillhör de oberoende t-testerna. Proverna av dessa typer väljs oberoende av varandra – det vill säga att datamängderna i de två grupperna inte refererar till samma värden. De inkluderar fall som att en grupp på 100 patienter delas upp i två uppsättningar med 50 patienter vardera. En av grupperna blir kontrollgrupp och får placebo medan den andra gruppen får den ordinerade behandlingen. Detta utgör två oberoende urvalsgrupper som är oparade med varandra.

Lika varians (eller poolad) T-test

Lika varians t-testet används när antalet sampel i varje grupp är detsamma, eller variansen för de två datamängderna är liknande. Följande formel används för att beräkna t-värde och frihetsgrader för lika varians t-test:

$\begin&\text = \frac{ mean1 - mean2 }{\frac {(n1 - 1) \times var1$

10 -0

c4,-6.7,10,-10,18,-10 H400000v40

H1013.1s-83.4,268,-264.1,840c-180.7.572,-277.876.3,-289.913c-4.7,4.7,-12.7,7,-24,7

s-12,0,-12,0c-1,3,-3,3,-3,7,-11,7,-7,-25c-35,3,-125,3,-106,7,-373,3,-214,-744

c-10,12,-21,25,-33,39s-32,39,-32,39c-6,-5,3,-15,-14,-27,-26s25,-30,25,-30

c26.7,-32.7,52,-63,76,-91s52,-60,52,-60s208,722,208,722

c56,-175.3,126.3,-397.3,211,-666c84.7,-268.7,153.8,-488.2,207.5,-658.5

c53.7,-170.3,84.5,-266.8,92.5,-289.5z

M1001 80h400000v40h-400000z'/> mean1−mean2där:mean1 och mean2=Genomsnittliga värden för varjeav provuppsättningarnavar 1 och var2= Varians för var och en av provuppsättningarnan1 och n2= Antal poster i varje provuppsättning

och,

$\begin &\text = n1 + n2 - 2 \ &\textbf{där:}\ &n1 \text n2 = \text{Antal poster i varje exempeluppsättning} \ \end$

Ojämn varians T-Test

Ojämlika varians t-testet används när antalet sampel i varje grupp är olika, och variansen för de två datamängderna är också olika. Detta test kallas även Welchs t-test. Följande formel används för att beräkna t-värde och frihetsgrader för ett t-test med ojämn varians:

$\begin&\text {T-värde}=\frac{\sqrt{\bigg(\frac{+\frac\bigg)}}}\&\textbf {där:}\&mean1 \text mean2 = \text{Genomsnittsvärden för varje} \&\text{i exempelmängderna} \&var1 \text var2 = \text \&n1 \text n2 = \text{Antal poster i varje provuppsättning} \end$

c339.3,-1799.3,509.3,-2700,510,-2702 l0 -0

c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7

s-90.5,478,-276.2,1466c-185.7,988,-279.5,1483,-281.5,1485c-2,6,-10,9,-24,9

c-8,0,-12,-0,7,-12,-2c0,-1,3,-5,3,-32,-16,-92c-50,7,-293,3,-119,7,-693,3,-207,-1200

c0,-1,3,-5,3,8,7,-16,30c-10,7,21,3,-21,3,42,7,-32,64s-16,33,-16,33s-26,-26,-26,-26

s76,-153,76,-153s77,-151,77,-151c0.7,0.7,35.7,202,105,604c67.3,400.7,102,602.7,104,

606zM1001 80h400000v40H1017.7z'/> mean1−mean2 span class="vlist" style="height:2.93em;">där: mea n1 och mean2=Genomsnittliga värden för varje av provuppsättningarnavar1 och v ar2=Varians för var och en av provuppsättningarnan1 och n2=Antal poster i varje provuppsättning

och,

$\begin &\text = \frac{ \left ( \frac{ var1$

Bestämma det rätta T-testet som ska användas

Följande flödesschema kan användas för att bestämma vilket t-test som ska användas baserat på egenskaperna hos provuppsättningarna. De nyckelpunkter som ska beaktas inkluderar huruvida provposterna är lika, antalet dataposter i varje provuppsättning och variansen för varje provuppsättning.

Ojämn varians T-Test Exempel

Antag att vi tar ett diagonalt mått på målningar som tagits emot i ett konstgalleri. En grupp av prover omfattar 10 målningar, medan den andra innehåller 20 målningar. Datauppsättningarna, med motsvarande medelvärde och variansvärden, är följande:

TTT

Även om medelvärdet för set 2 är högre än för set 1, kan vi inte dra slutsatsen att populationen som motsvarar set 2 har ett högre medelvärde än populationen som motsvarar set 1. Beror skillnaden från 19,4 till 21,6 enbart på slumpen, eller gör det Finns det verkligen skillnader i den totala populationen av alla målningar som tas emot i konsthallen? Vi etablerar problemet genom att anta nollhypotesen att medelvärdet är detsamma mellan de två urvalsuppsättningarna och genomför ett t-test för att testa om hypotesen är rimlig.

Eftersom antalet dataposter är olika (n1 = 10 och n2 = 20) och variansen också är olika, beräknas t-värdet och frihetsgraderna för ovanstående datamängd med hjälp av formeln som nämns i Ojämlika varians T-testet sektion.

t-värdet är -2,24787. Eftersom minustecknet kan ignoreras när man jämför de två t-värdena, är det beräknade värdet 2,24787.

Värdet för frihetsgrader är 24,38 och reduceras till 24, på grund av att formeldefinitionen kräver avrundning nedåt av värdet till minsta möjliga heltalsvärde.

Man kan ange en sannolikhetsnivå (alfanivå, signifikansnivå, p) som kriterium för acceptans. I de flesta fall kan ett värde på 5 % antas.

Om man använder frihetsgradsvärdet som 24 och en signifikansnivå på 5 %, ger en titt på t-värdesfördelningstabellen ett värde på 2,064. Att jämföra detta värde med det beräknade värdet på 2,247 indikerar att det beräknade t-värdet är större än tabellvärdet vid en signifikansnivå på 5 %. Därför är det säkert att förkasta nollhypotesen att det inte finns någon skillnad mellan medel. Befolkningsuppsättningen har inneboende skillnader, och de är inte av en slump.

Höjdpunkter

Ett t-test är en typ av inferentiell statistik som används för att avgöra om det finns en signifikant skillnad mellan medelvärdena för två grupper, som kan vara relaterade i vissa egenskaper.

– T-testet är ett av många test som används för hypotesprövning i statistik.

– Det finns flera olika typer av t-test som kan utföras beroende på vilken data och typ av analys som krävs.

För att beräkna ett t-test krävs tre nyckeldatavärden. De inkluderar skillnaden mellan medelvärdena från varje datamängd (kallad medelskillnad), standardavvikelsen för varje grupp och antalet datavärden för varje grupp.