T-test

Hvad er en T-test?

En t-test er en type inferentiel statistik,. der bruges til at bestemme, om der er en signifikant forskel mellem middelværdierne for to grupper, som kan være relateret i visse funktioner. Det bruges mest, når datasættene, ligesom datasættet registreret som resultatet af at vende en mønt 100 gange, ville følge en normal fordeling og kan have ukendte varianser. En t-test bruges som et hypotesetestværktøj, som gør det muligt at teste en antagelse gældende for en population.

En t-test ser på t-statistikken, t-fordelingsværdierne og frihedsgrader til at bestemme den statistiske signifikans. For at udføre en test med tre eller flere midler skal man bruge en variansanalyse.

Forklaring af T-testen

Grundlæggende giver en t-test os mulighed for at sammenligne gennemsnitsværdierne af de to datasæt og bestemme, om de kom fra den samme population. I ovenstående eksempler, hvis vi skulle tage et udsnit af elever fra klasse A og et andet udsnit af elever fra klasse B, ville vi ikke forvente, at de havde nøjagtig samme middelværdi og standardafvigelse. Tilsvarende bør prøver taget fra den placebo-fodrede kontrolgruppe og dem taget fra den lægeordinerede gruppe have en lidt anderledes middelværdi og standardafvigelse.

Matematisk tager t-testen en prøve fra hvert af de to sæt og etablerer problemformuleringen ved at antage en nulhypotese om, at de to middelværdier er lige store. Ud fra de gældende formler beregnes og sammenlignes visse værdier med standardværdierne, og den forudsatte nulhypotese accepteres eller forkastes i overensstemmelse hermed.

Hvis nulhypotesen kvalificerer sig til at blive forkastet, indikerer det, at dataaflæsninger er stærke og sandsynligvis ikke skyldes tilfældigheder.

T-testen er blot en af mange tests, der bruges til dette formål. Statistikere skal desuden bruge andre test end t-testen til at undersøge flere variabler og test med større stikprøvestørrelser. For en stor stikprøvestørrelse bruger statistikere en z-test. Andre testmuligheder omfatter chi-square-testen og f-testen.

Der er tre typer af t-test, og de er kategoriseret som afhængige og uafhængige t-tests.

Tvetydige testresultater

Overvej, at en lægemiddelproducent ønsker at teste en nyopfundet medicin. Det følger standardproceduren med at prøve lægemidlet på én gruppe patienter og give placebo til en anden gruppe, kaldet kontrolgruppen. Placeboen givet til kontrolgruppen er et stof uden tilsigtet terapeutisk værdi og tjener som benchmark til at måle, hvordan den anden gruppe, som får det faktiske lægemiddel, reagerer.

Efter lægemiddelforsøget rapporterede medlemmerne af den placebo-fodrede kontrolgruppe en stigning i den gennemsnitlige levealder på tre år, mens de medlemmer af gruppen, der får ordineret det nye lægemiddel, rapporterer om en stigning i den gennemsnitlige levealder på fire år. Øjeblikkelig observation kan indikere, at stoffet faktisk virker, da resultaterne er bedre for gruppen, der bruger stoffet. Det er dog også muligt, at observationen kan skyldes en tilfældig hændelse, især et overraskende held. En t-test er nyttig til at konkludere, om resultaterne faktisk er korrekte og anvendelige for hele populationen.

På en skole scorede 100 elever i klasse A i gennemsnit 85 % med en standardafvigelse på 3 %. Yderligere 100 elever i klasse B scorede i gennemsnit 87 % med en standardafvigelse på 4 %. Selvom gennemsnittet af klasse B er bedre end for klasse A, er det måske ikke korrekt at drage til den konklusion, at den samlede præstation for elever i klasse B er bedre end for elever i klasse A. Dette skyldes, at der er naturlig variabilitet i testresultaterne i begge klasser, så forskellen kan alene skyldes tilfældigheder. En t-test kan være med til at afgøre, om den ene klasse klarede sig bedre end den anden.

T-testantagelser

Den første antagelse om t-tests vedrører måleskalaen. Antagelsen for en t-test er, at måleskalaen anvendt på de indsamlede data følger en kontinuerlig eller ordinær skala, såsom scorerne for en IQ-test.
Den anden antagelse, der er gjort, er, at en simpel tilfældig stikprøve er, at dataene er indsamlet fra en repræsentativ, tilfældigt udvalgt del af den samlede population.
Den tredje antagelse er, at dataene, når de er plottet, resulterer i en normalfordeling, klokkeformet fordelingskurve.
Den endelige antagelse er variansens homogenitet. Homogen eller lige stor varians eksisterer, når standardafvigelserne for prøver er omtrent lige store.

Beregning af T-tests

Beregning af en t-test kræver tre nøgledataværdier. De inkluderer forskellen mellem middelværdierne fra hvert datasæt (kaldet middelforskellen), standardafvigelsen for hver gruppe og antallet af dataværdier for hver gruppe.

Resultatet af t-testen producerer t-værdien. Denne beregnede t-værdi sammenlignes derefter med en værdi opnået fra en kritisk værditabel (kaldet T-fordelingstabellen). Denne sammenligning hjælper med at bestemme effekten af tilfældighed alene på forskellen, og om forskellen er uden for dette chanceområde. T-testen stiller spørgsmålstegn ved, om forskellen mellem grupperne repræsenterer en sand forskel i undersøgelsen, eller om det muligvis er en meningsløs tilfældig forskel.

T-distributionstabeller

T-fordelingstabellen er tilgængelig i formater med én hale og to hale . Førstnævnte bruges til at vurdere sager, som har en fast værdi eller et område med en klar retning (positiv eller negativ). For eksempel, hvad er sandsynligheden for, at outputværdien forbliver under -3, eller for at få mere end syv, når du kaster et par terninger? Sidstnævnte bruges til områdebundet analyse, såsom at spørge om koordinaterne falder mellem -2 og +2.

Beregningerne kan udføres med standard softwareprogrammer, der understøtter de nødvendige statistiske funktioner, som dem der findes i MS Excel.

T-værdier og frihedsgrader

t-testen producerer to værdier som output: t-værdi og frihedsgrader. t-værdien er et forhold mellem forskellen mellem middelværdien af de to prøvesæt og den variation, der findes inden for prøvesættene. Mens tællerværdien (forskellen mellem middelværdien af de to prøvesæt) er ligetil at beregne, kan nævneren (variationen, der findes inden for prøvesættene) blive en smule kompliceret afhængigt af typen af dataværdier, der er involveret. Nævneren af forholdet er et mål for spredningen eller variabiliteten. Højere værdier af t-værdien, også kaldet t-score, indikerer, at der er en stor forskel mellem de to stikprøvesæt. Jo mindre t-værdien er, jo mere lighed er der mellem de to prøvesæt.

En stor t-score indikerer, at grupperne er forskellige.
En lille t-score indikerer, at grupperne ligner hinanden.

Frihedsgrader refererer til de værdier i en undersøgelse, der har frihed til at variere og er væsentlige for at vurdere vigtigheden og validiteten af nulhypotesen. Beregning af disse værdier afhænger normalt af antallet af tilgængelige dataposter i prøvesættet.

Korreleret (eller parret) T-test

Den korrelerede t-test udføres, når prøverne typisk består af matchede par af lignende enheder, eller når der er tilfælde af gentagne målinger. For eksempel kan der være tilfælde af, at de samme patienter bliver testet gentagne gange - før og efter at have modtaget en bestemt behandling. I sådanne tilfælde bliver hver patient brugt som en kontrolprøve mod sig selv.

Denne metode gælder også for tilfælde, hvor prøverne er beslægtede på en eller anden måde eller har matchende karakteristika, såsom en sammenlignende analyse, der involverer børn, forældre eller søskende. Korrelerede eller parrede t-tests er af en afhængig type, da disse involverer tilfælde, hvor de to sæt prøver er relaterede.

Formlen til beregning af t-værdien og frihedsgrader for en parret t-test er:

$\begin{aligned} T = \frac{middel 1 - middel 2}{< mfrac>} \\ < /mstyle> & hvor: \\ middel 1 og middel 2 =</ mo>Gennemsnitsværdierne for hvert af prøvesættene \\ s</ mi>(diff)=Standardafvigelsen af forskellene mellem de parrede dataværdier \\ n = Samplestørrelsen (antallet af parrede forskelle) \\ > </mr ow> & n -</ mo>1=Graderne af frihed \end{aligned} < annotation encoding="application/x-tex">\begin&T=\frac{\textit1 - \textit2}{\frac{s(\text)} {\sqrt{(n)}}}\&\textbf\&\textit1\text\textit2=\text{Gennemsnitsværdierne for hver af prøvesættene}\&s(\text)=\text{Standardafvigelsen af forskellene mellem de parrede dataværdier}\&n=\text{Samplestørrelsen (antallet af parrede forskelle)}\&n-1=\text\end$ >T=(n)<svg width='400em' height='1.5428571428571431em' viewBox='0 0 400000 1080' preserveAspectRatio='9MinY7 slice='9MinY7 slice='9MinY7 slice

c-2.7,0,-7.17,-2.7,-13.5,-8c-5.8,-5.3,-9.5,-10,-9.5,-14

c0,-2,0,3,-3,3,1,-4c1,3,-2,7,23,83,-20,7,67,5,-54

c44.2,-33.3,65.8,-50.3,66.5,-51c1.3,-1.3,3,-2,5,-2c4.7,0,8.7,3.3,12,10

s173,378,173,378c0,7,0,35,3,-71,104,-213c68,7,-142,137,5,-285,206,5,-429

c69,-144,104,5,-217,7,106,5,-221

10 -0

c5,3,-9,3,12,-14,20,-14

H400000v40H845.2724

s-225,272,467,-225,272,467s-235,486,-235,486c-2,7,4,7,-9,7,-19,7

c-6,0,-10,-1,-12,-3s-194,-422,-194,-422s-65,47,-65,47z

M834 80h400000v40h-400000z'/> s(diff) mean1−mean2hvor:mean 1 og mean2=Gennemsnitsværdierne for hvert af prøvesættenes(diff )=Standardafvigelsen af forskellene mellem de parrede dataværdier n=Samplestørrelsen (antallet af parrede forskelle)n−1=Frihedsgraderne

De resterende to typer tilhører de uafhængige t-tests. Prøverne af disse typer er udvalgt uafhængigt af hinanden - det vil sige, at datasættene i de to grupper ikke refererer til de samme værdier. De omfatter tilfælde som en gruppe på 100 patienter, der er opdelt i to sæt på 50 patienter hver. En af grupperne bliver kontrolgruppe og får placebo, mens den anden gruppe får den ordinerede behandling. Dette udgør to uafhængige stikprøvegrupper, som er uparrede med hinanden.

Equal Variance (eller Pooled) T-test

Den lige varians t-test bruges, når antallet af prøver i hver gruppe er det samme, eller variansen af de to datasæt er ens. Følgende formel bruges til at beregne t-værdi og frihedsgrader for lige varians t-test:

$\begin&\text = \frac{ mean1 - mean2 }{\frac {(n1 - 1) \times var1$

10 -0

c4,-6.7,10,-10,18,-10 H400000v40

H1013.1s-83.4,268,-264.1,840c-180.7.572,-277.876.3,-289.913c-4.7,4.7,-12.7,7,-24,7

s-12,0,-12,0c-1,3,-3,3,-3,7,-11,7,-7,-25c-35,3,-125,3,-106,7,-373,3,-214,-744

c-10,12,-21,25,-33,39s-32,39,-32,39c-6,-5,3,-15,-14,-27,-26s25,-30,25,-30

c26.7,-32.7,52,-63,76,-91s52,-60,52,-60s208,722,208,722

c56,-175,3,126,3,-397,3,211,-666c84,7,-268,7,153,8,-488,2,207,5,-658,5

c53.7,-170.3,84.5,-266.8,92.5,-289.5z

M1001 80h400000v40h-400000z'/> mean1−mean2hvor:mean1 og mean2=Gennemsnitlige værdier for hveraf prøvesættenevar 1 og var2= Varians af hvert af prøvesættenen1 og n2= Antal poster i hvert eksempelsæt

og,

$\begin &\text = n1 + n2 - 2 \ &\textbf\ &n1 \text n2 = \text{Antal poster i hvert eksempelsæt} \ \end$

Ulige varians T-test

Den ulige varians t-test bruges, når antallet af prøver i hver gruppe er forskelligt, og variansen af de to datasæt er også forskellig. Denne test kaldes også Welch's t-test. Følgende formel bruges til at beregne t-værdi og frihedsgrader for en ulige varians t-test:

$\begin&\text {T-værdi}=\frac{\sqrt{\bigg(\frac{+\frac\bigg)}}}\&\textbf \&mean1 \text mean2 = \text{Gennemsnitsværdier af hver} \&\text{af prøvesættene} \&var1 \text var2 = \text {Varians af hvert af prøvesættene} \&n1 \text n2 = \text{Antal poster i hvert prøvesæt} \end$

c339.3,-1799.3,509.3,-2700,510,-2702 l0 -0

c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7

s-90,5,478,-276,2,1466c-185,7,988,-279,5,1483,-281,5,1485c-2,6,-10,9,-24,9

c-8,0,-12,-0,7,-12,-2c0,-1,3,-5,3,-32,-16,-92c-50,7,-293,3,-119,7,-693,3,-207,-1200

c0,-1,3,-5,3,8,7,-16,30c-10,7,21,3,-21,3,42,7,-32,64s-16,33,-16,33s-26,-26,-26,-26

s76,-153,76,-153s77,-151,77,-151c0.7,0.7,35.7,202,105,604c67.3,400.7,102,602.7,104,

606zM1001 80h400000v40H1017.7z'/> mean1−mean2 span class="vlist" style="height:2.93em;">hvor: mea n1 og mean2=Gennemsnitsværdier for hver af prøvesættenevar1 og v ar2=Varians af hvert af prøvesættenen1 og n2=Antal poster i hvert prøvesæt

og,

$\begin &\text = \frac{ \left ( \frac{ var1$

Bestemmelse af den korrekte T-test, der skal bruges

Følgende rutediagram kan bruges til at bestemme, hvilken t-test der skal bruges baseret på karakteristikaene for prøvesættene. De nøglepunkter, der skal tages i betragtning, omfatter, om prøveposterne er ens, antallet af dataposter i hvert prøvesæt og variansen af hvert prøvesæt.

Ulige varians T-test eksempel

Antag, at vi tager en diagonal måling af malerier modtaget i et kunstgalleri. Den ene gruppe prøver omfatter 10 malerier, mens den anden omfatter 20 malerier. Datasættene med de tilsvarende middelværdier og variansværdier er som følger:

TTT

Selvom gennemsnittet af sæt 2 er højere end for sæt 1, kan vi ikke konkludere, at populationen svarende til sæt 2 har et højere gennemsnit end populationen svarende til sæt 1. Skyldes forskellen fra 19,4 til 21,6 alene tilfældigheder, eller gør det eksisterer der virkelig forskelle i den samlede befolkning af alle de malerier, der modtages i kunstgalleriet? Vi etablerer problemet ved at antage nulhypotesen, at middelværdien er den samme mellem de to stikprøvesæt og udfører en t-test for at teste, om hypotesen er plausibel.

Da antallet af dataposter er forskelligt (n1 = 10 og n2 = 20), og variansen også er forskellig, beregnes t-værdien og frihedsgrader for ovenstående datasæt ved hjælp af formlen nævnt i Ulige varians T-testen afsnit.

t-værdien er -2,24787. Da minustegnet kan ignoreres, når de to t-værdier sammenlignes, er den beregnede værdi 2,24787.

Frihedsgradersværdien er 24,38 og reduceres til 24, på grund af formeldefinitionen, der kræver afrunding af værdien til den mindst mulige heltalværdi.

Man kan angive et sandsynlighedsniveau (alfaniveau, signifikansniveau, p) som et kriterium for accept. I de fleste tilfælde kan der antages en værdi på 5 %.

Ved at bruge frihedsgradsværdien som 24 og et signifikansniveau på 5 %, giver et kig på t-værdifordelingstabellen en værdi på 2,064. Sammenligning af denne værdi med den beregnede værdi på 2,247 indikerer, at den beregnede t-værdi er større end tabelværdien ved et signifikansniveau på 5 %. Derfor er det sikkert at afvise nulhypotesen om, at der ikke er nogen forskel mellem middel. Befolkningssættet har iboende forskelle, og de er ikke tilfældige.

Højdepunkter

En t-test er en type inferentiel statistik, der bruges til at bestemme, om der er en signifikant forskel mellem middelværdierne for to grupper, som kan være relateret i visse træk.
T-testen er en af mange test, der bruges med henblik på hypotesetestning i statistik.
Der er flere forskellige typer af t-test, der kan udføres afhængigt af de nødvendige data og type analyse.
Beregning af en t-test kræver tre nøgledataværdier. De inkluderer forskellen mellem middelværdierne fra hvert datasæt (kaldet middelforskellen), standardafvigelsen for hver gruppe og antallet af dataværdier for hver gruppe.