Investor's wiki

T-Test

T-Test

Hva er en T-test?

En t-test er en type inferensiell statistikk som brukes til å avgjøre om det er en signifikant forskjell mellom middelene til to grupper, som kan være relatert i visse funksjoner. Det brukes mest når datasettene, som datasettet registrert som utfallet av å snu en mynt 100 ganger, vil følge en normalfordeling og kan ha ukjente varianser. En t-test brukes som et hypotesetestingsverktøy, som tillater testing av en antakelse som gjelder for en populasjon.

En t-test ser på t-statistikken, t-fordelingsverdiene og frihetsgradene til å bestemme den statistiske signifikansen. For å gjennomføre en test med tre eller flere midler, må man bruke en variansanalyse.

Forklarer T-testen

I hovedsak lar en t-test oss sammenligne gjennomsnittsverdiene til de to datasettene og bestemme om de kom fra samme populasjon. I eksemplene ovenfor, hvis vi skulle ta et utvalg elever fra klasse A og et annet utvalg elever fra klasse B, ville vi ikke forvente at de hadde nøyaktig samme gjennomsnitt og standardavvik. Tilsvarende bør prøver tatt fra den placebo-matede kontrollgruppen og de som er tatt fra den foreskrevne medikamentgruppen ha litt forskjellig gjennomsnitt og standardavvik.

Matematisk tar t-testen et utvalg fra hvert av de to settene og etablerer problemformuleringen ved å anta en nullhypotese om at de to middelverdiene er like. Basert på gjeldende formler beregnes visse verdier og sammenlignes med standardverdiene, og den antatte nullhypotesen aksepteres eller forkastes tilsvarende.

Hvis nullhypotesen kvalifiserer til å bli forkastet, indikerer det at dataavlesningene er sterke og sannsynligvis ikke skyldes tilfeldigheter.

T-testen er bare en av mange tester som brukes til dette formålet. Statistikere må i tillegg bruke andre tester enn t-testen for å undersøke flere variabler og tester med større utvalgsstørrelser. For en stor prøvestørrelse bruker statistikere en z-test. Andre testalternativer inkluderer kjikvadrattesten og f-testen.

Det finnes tre typer t-tester, og de er kategorisert som avhengige og uavhengige t-tester.

Tvetydige testresultater

Tenk på at en legemiddelprodusent ønsker å teste en nyoppfunnet medisin. Den følger standardprosedyren for å prøve stoffet på en gruppe pasienter og gi placebo til en annen gruppe, kalt kontrollgruppen. Placeboen gitt til kontrollgruppen er et stoff uten tiltenkt terapeutisk verdi og fungerer som en målestokk for å måle hvordan den andre gruppen, som får det faktiske stoffet, reagerer.

Etter legemiddelutprøvingen rapporterte medlemmene av den placebo-matede kontrollgruppen en økning i gjennomsnittlig levealder på tre år, mens medlemmene av gruppen som får foreskrevet det nye legemidlet rapporterer om en økning i gjennomsnittlig levealder på fire år. Øyeblikkelig observasjon kan indikere at stoffet faktisk virker ettersom resultatene er bedre for gruppen som bruker stoffet. Det er imidlertid også mulig at observasjonen kan skyldes en tilfeldig hendelse, spesielt et overraskende lykketreff. En t-test er nyttig for å konkludere om resultatene faktisk er korrekte og gjelder for hele populasjonen.

På en skole skåret 100 elever i klasse A i gjennomsnitt 85 % med et standardavvik på 3 %. Ytterligere 100 elever i klasse B skåret i gjennomsnitt 87 % med et standardavvik på 4 %. Selv om gjennomsnittet for klasse B er bedre enn klasse A, er det kanskje ikke riktig å konkludere med at den generelle ytelsen til elevene i klasse B er bedre enn for elevene i klasse A. Dette er fordi det er naturlig variasjon i testresultatene i begge klassene, så forskjellen kan skyldes tilfeldigheter alene. En t-test kan bidra til å avgjøre om den ene klassen klarte seg bedre enn den andre.

T-testforutsetninger

  1. Den første antagelsen som ble gjort angående t-tester gjelder måleskalaen. Forutsetningen for en t-test er at måleskalaen brukt på dataene som samles inn, følger en kontinuerlig eller ordinær skala, for eksempel poengsummen for en IQ-test.

  2. Den andre antagelsen som er gjort er at av et enkelt tilfeldig utvalg, at dataene er samlet inn fra en representativ, tilfeldig valgt del av den totale populasjonen.

  3. Den tredje antakelsen er at dataene, når de er plottet, resulterer i en normalfordeling, klokkeformet distribusjonskurve.

  4. Den endelige antakelsen er variansens homogenitet. Homogen eller lik varians eksisterer når standardavvikene til prøvene er omtrent like.

Beregner T-tester

Å beregne en t-test krever tre nøkkeldataverdier. De inkluderer forskjellen mellom gjennomsnittsverdiene fra hvert datasett (kalt gjennomsnittlig forskjell), standardavviket for hver gruppe og antall dataverdier for hver gruppe.

Utfallet av t-testen produserer t-verdien. Denne beregnede t-verdien sammenlignes deretter mot en verdi hentet fra en kritisk verditabell (kalt T-fordelingstabellen). Denne sammenligningen hjelper til med å bestemme effekten av tilfeldighet alene på forskjellen, og om forskjellen er utenfor det sjanseområdet. T-testen stiller spørsmål ved om forskjellen mellom gruppene representerer en sann forskjell i studien eller om det muligens er en meningsløs tilfeldig forskjell.

T-distribusjonstabeller

T-distribusjonstabellen er tilgjengelig i formater med én hale og to hale . Førstnevnte brukes til å vurdere saker som har en fast verdi eller rekkevidde med en klar retning (positiv eller negativ). Hva er for eksempel sannsynligheten for at utgangsverdien forblir under -3, eller får mer enn syv når du kaster et par terninger? Sistnevnte brukes til avstandsbundet analyse, for eksempel å spørre om koordinatene faller mellom -2 og +2.

Beregningene kan utføres med standard programvare som støtter de nødvendige statistiske funksjonene, som de som finnes i MS Excel.

T-verdier og frihetsgrader

t-testen produserer to verdier som sin utgang: t-verdi og frihetsgrader. t-verdien er et forhold mellom forskjellen mellom gjennomsnittet av de to prøvesettene og variasjonen som eksisterer innenfor prøvesettene. Mens tellerverdien (forskjellen mellom gjennomsnittet av de to prøvesettene) er enkel å beregne, kan nevneren (variasjonen som finnes innenfor prøvesettene) bli litt komplisert avhengig av typen dataverdier som er involvert. Nevneren for forholdet er et mål på spredningen eller variabiliteten. Høyere verdier av t-verdien, også kalt t-score, indikerer at det er stor forskjell mellom de to prøvesettene. Jo mindre t-verdien er, jo mer likhet er det mellom de to prøvesettene.

– En stor t-score indikerer at gruppene er forskjellige.

– En liten t-skåre indikerer at gruppene er like.

Frihetsgrader refererer til verdiene i en studie som har frihet til å variere og er essensielle for å vurdere viktigheten og gyldigheten av nullhypotesen. Beregning av disse verdiene avhenger vanligvis av antallet dataposter som er tilgjengelige i prøvesettet.

Korrelert (eller sammenkoblet) T-test

Den korrelerte t-testen utføres når prøvene typisk består av matchede par av lignende enheter, eller når det er tilfeller av gjentatte mål. For eksempel kan det være tilfeller av at de samme pasientene blir testet gjentatte ganger – før og etter å ha mottatt en bestemt behandling. I slike tilfeller blir hver pasient brukt som en kontrollprøve mot seg selv.

Denne metoden gjelder også for tilfeller der prøvene er relatert på en eller annen måte eller har samsvarende egenskaper, for eksempel en komparativ analyse som involverer barn, foreldre eller søsken. Korrelerte eller sammenkoblede t-tester er av en avhengig type, da disse involverer tilfeller der de to settene med prøver er relatert.

Formelen for å beregne t-verdien og frihetsgrader for en paret t-test er:

T=gjennomsnitt1−middel2< mfrac>s(diff)(n)< /mfrac>< /mstyle>hvor:gjennomsnitt1 og gjennomsnitt2=</ mo>Gjennomsnittsverdiene for hvert av prøvesettenes</ mi>(diff)=Standardavviket av forskjellene mellom de sammenkoblede dataverdiene n= Samplestørrelsen (antall parede forskjeller)</mr ow>n−</ mo>1=Frihetsgradene< annotation encoding="application/x-tex">\begin&T=\frac{\textit1 - \textit2}{\frac{s(\text)} {\sqrt{(n)}}}\&\textbf\&\textit1\text\textit2=\text{Gjennomsnittsverdiene for hver av prøvesettene}\&s(\text)=\text\&n=\text{Samplestørrelsen (antall parede forskjeller)}\&n-1=\text\end<span class="katex-html" aria -hidden="true">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="mord">​>< span class="vlist-t vlist-t2">T=< /span>(n)<svg width='400em' height='1.5428571428571431em' viewBox='0 0 400000 1080' preserveAspectRatio='><5428571428571431em'

c-2.7,0,-7.17,-2.7,-13.5,-8c-5.8,-5.3,-9.5,-10,-9.5,-14

c0,-2,0,3,-3,3,1,-4c1,3,-2,7,23,83,-20,7,67,5,-54

c44.2,-33.3,65.8,-50.3,66.5,-51c1.3,-1.3,3,-2,5,-2c4.7,0,8.7,3.3,12,10

s173,378,173,378c0,7,0,35,3,-71,104,-213c68,7,-142,137,5,-285,206,5,-429

c69,-144,104,5,-217,7,106,5,-221

l0 -0

c5,3,-9,3,12,-14,20,-14

H400000v40H845.2724

s-225.272,467,-225.272,467s-235.486,-235.486c-2.7,4.7,-9,7,-19,7

c-6,0,-10,-1,-12,-3s-194,-422,-194,-422s-65,47,-65,47z

M834 80h400000v40h-400000z'/>​ s(</ span>diff)</ span>​ </ span>mean1−mean2< span class="vlist-s">​</ span>hvor:< /span>mean 1 og mean2</ span>=Gjennomsnittsverdiene for hvert av prøvesettenes(diff )=Standardavviket for forskjellene mellom de sammenkoblede dataverdiene n< span class="mrel">=Utvalgsstørrelsen (antall parede forskjeller)n−1=Frihetsgradene​

De resterende to typene tilhører de uavhengige t-testene. Eksemplene av disse typene velges uavhengig av hverandre – det vil si at datasettene i de to gruppene ikke refererer til de samme verdiene. De inkluderer tilfeller som en gruppe på 100 pasienter som er delt inn i to sett med 50 pasienter hver. En av gruppene blir kontrollgruppe og får placebo, mens den andre gruppen får foreskrevet behandling. Dette utgjør to uavhengige utvalgsgrupper som ikke er paret med hverandre.

Lik varians (eller sammenslått) T-test

Likvarians t-testen brukes når antallet prøver i hver gruppe er det samme, eller variansen til de to datasettene er lik. Følgende formel brukes for å beregne t-verdi og frihetsgrader for lik varians t-test:

T-verdi= mean1−m< /mi>ean2(n1−1)×var1< mn>2+(n2−1)×var22n 1+n2−2< /mfrac>×1n1+1< /mn>n2 < mstyle scriptlevel="0" displaystyle="true">hvor:</ mtr>mean1</ mn> og mean2 =Gjennomsnittsverdier for hverav eksempelsettv</ mi>ar1 og va r2=Varians for hvert av prøvesettene n1 og n2 =Antall poster i hvert eksempelsett\begin&\text = \frac{ mean1 - mean2 }{\frac {(n1 - 1) \times var12 + (n2 - 1) \times var22 }{ n1 +n2 - 2}\times \sqrt{ \frac{1} + \frac{1}} } \&\textbf\&amp ;mean1 \text mean2 = \text \&\tekst{av prøvesettene}\&var1 \text var2 = \tekst{Varians for hvert av prøvene sett s}\&n1 \text n2 = \text \end

l0 -0

c4,-6.7,10,-10,18,-10 H400000v40

H1013.1s-83.4,268,-264.1,840c-180.7.572,-277.876.3,-289.913c-4.7,4.7,-12.7,7,-24,7

s-12,0,-12,0c-1,3,-3,3,-3,7,-11,7,-7,-25c-35,3,-125,3,-106,7,-373,3,-214,-744

c-10,12,-21,25,-33,39s-32,39,-32,39c-6,-5,3,-15,-14,-27,-26s25,-30,25,-30

c26.7,-32.7,52,-63,76,-91s52,-60,52,-60s208,722,208,722

c56,-175,3,126,3,-397,3,211,-666c84,7,-268,7,153,8,-488,2,207,5,-658,5

c53.7,-170.3,84.5,-266.8,92.5,-289.5z

M1001 80h400000v40h-400000z'/>​ < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< span class="mord mathnormal">ean2​hvor:< /span>mea< span class="mord mathnormal">n1 og </ span>mean2< span class="mspace" style="margin-right:0.2777777777777778em;">=Gjennomsnittsverdier for hver< span class="mord text">av prøvesettene< span class="psrut" style="height:3.32144em;">var 1 og var2= Varians for hvert av prøvesettenen1 og n2= Antall poster i hvert prøvesett​</ span>

og,

Frihetsgrader=n< mn>1+n2−2 hvor:< /mtr>n1 og n2< /mn>=Antall poster i hvert eksempelsett</m tr>\begin &\text = n1 + n2 - 2 \ &\textbf\ &n1 \text n2 = \text \ \end

Ulik varians T-test

Ulik varians t-testen brukes når antall prøver i hver gruppe er forskjellig, og variansen til de to datasettene er også forskjellig. Denne testen kalles også Welchs t-test. Følgende formel brukes for å beregne t-verdi og frihetsgrader for en ulik varians t-test:

T-verdi= mean1−m< /mi>ean2(var1 n1+v</ mi>ar2n2< /mrow>)</ mtr>hvor: me an1 og me</ mi>an2=Gjennomsnittsverdier for hver< /mstyle>av eksempelsettenevar1 og var2=Varians for hvert av prøvesettene</ mtext> n1 og n2=Antall poster i hvert eksempelsett\begin&\text =\frac{\sqrt{\bigg(\frac{+\frac\bigg)}}}\&\textbf \&mean1 \text mean2 = \text \&\text{av prøvesettene} \&var1 \text var2 = \text \&n1 \text n2 = \text \end< /span>T-verdi< /span>=>< span class="vlist-r">( n1 var 1​ /span>+< span class="mfrac"><span class="mord mtight" ">n2< /span>var2​ )<path d='M473,2793

c339.3,-1799.3,509.3,-2700,510,-2702 l0 -0

c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7

s-90.5,478,-276.2,1466c-185.7,988,-279.5,1483,-281.5,1485c-2,6,-10,9,-24,9

c-8,0,-12,-0,7,-12,-2c0,-1,3,-5,3,-32,-16,-92c-50,7,-293,3,-119,7,-693,3,-207,-1200

c0,-1,3,-5,3,8,7,-16,30c-10,7,21,3,-21,3,42,7,-32,64s-16,33,-16,33s-26,-26,-26,-26

s76,-153,76,-153s77,-151,77,-151c0.7,0.7,35.7,202,105,604c67.3,400.7,102,602.7,104,

606zM1001 80h400000v40H1017.7z'/>​ < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< span class="mord mathnormal">ean2​​ span class="vlist" style="height:2.93em;"></ span>hvor: mea n1 og < /span>mean2=Gjennomsnittsverdier for hver av prøvesettenevar1 og v ar2=</ span>Varians av hvert av prøvesettene<span class="mord" mord mathnormal">n1 og n2=Antall poster i hvert prøvesett​

og,

Frihetsgrader= (var1 2n1 +var22 n2)</ mo>2(< mi>var12 n1)2</ mn>n1−1 +(v</ mi>ar22n2)2n2−1</ mfrac></ mtd>hvor: var1 og var2=Varians for hvert av prøvesettene n1 og n< /mi>2=Antall poster i hvert eksempelsett< /mtable>\begin &\text = \frac{ \left ( \frac{ var12 } + \frac{ var22 } \right )2 }{ \frac{ \left ( \frac{ var12 } \right )2 }{ n1 - 1 } + \frac{ \left ( \frac { var22 } \right )^2 }{ n2 - 1}} \ &\textbf\ &var1 \text var2 = \text \ &n1 \text n2 = \text \ \end< span class="katex-html" aria-hidden="true">< /span>​ </sp an>Degrees of Freedom< /span>= </ span>n1< /span>−1< /span>( n1 < span class="psrut" style="height:3em;">var1< span class="vlist-r">2​)<span style=="pstrut" "height:2.5em;">2​</ span></ span>+n2−1</ span>(< span class="mord mtight">n2< /span>var< /span>22 ​ /span>) 2< /span>​ (n1var1< span class="vlist-r">2</ span>​< /span>< /span>+ n2< /span> v span>ar2</ span>2 ​ )2 ​<span class="mord" mord text">hvor:var< span class="mord">1 og var span>2=</ span>Varians av hvert av prøvesettenen1 og < span class="mord mathnormal">n2< span class="mrel">=Antall poster i hvert prøvesett​</ span>

Bestem den riktige T-testen som skal brukes

Følgende flytskjema kan brukes til å bestemme hvilken t-test som skal brukes basert på egenskapene til prøvesettene. Nøkkelelementene som skal vurderes inkluderer om prøvepostene er like, antall dataposter i hvert prøvesett og variansen til hvert prøvesett.

Ulik varians T-Test Eksempel

Anta at vi tar en diagonalmåling av malerier mottatt i et kunstgalleri. En gruppe prøver inkluderer 10 malerier, mens den andre inkluderer 20 malerier. Datasettene, med tilsvarende gjennomsnitts- og variansverdier, er som følger:

TTT

Selv om gjennomsnittet av sett 2 er høyere enn for sett 1, kan vi ikke konkludere med at populasjonen som tilsvarer sett 2 har et høyere gjennomsnitt enn populasjonen som tilsvarer sett 1. Er forskjellen fra 19,4 til 21,6 på grunn av tilfeldigheter alene, eller gjør det eksisterer det virkelig forskjeller i den totale populasjonen av alle maleriene som er mottatt i kunstgalleriet? Vi etablerer problemet ved å anta nullhypotesen at gjennomsnittet er det samme mellom de to utvalgssettene og gjennomfører en t-test for å teste om hypotesen er plausibel.

Siden antall dataposter er forskjellig (n1 = 10 og n2 = 20) og variansen også er forskjellig, beregnes t-verdien og frihetsgradene for datasettet ovenfor ved å bruke formelen nevnt i Unequal Variance T-testen seksjon.

t-verdien er -2,24787. Siden minustegnet kan ignoreres når de to t-verdiene sammenlignes, er den beregnede verdien 2,24787.

Frihetsgradsverdien er 24,38 og reduseres til 24, på grunn av formeldefinisjonen som krever avrunding av verdien til minst mulig heltallsverdi.

Man kan spesifisere et sannsynlighetsnivå (alfanivå, signifikansnivå, p) som et kriterium for aksept. I de fleste tilfeller kan det antas en verdi på 5 %.

Ved å bruke frihetsgradsverdien som 24 og et signifikansnivå på 5 %, gir en titt på t-verdifordelingstabellen en verdi på 2,064. Å sammenligne denne verdien med den beregnede verdien på 2,247 indikerer at den beregnede t-verdien er større enn tabellverdien ved et signifikansnivå på 5 %. Derfor er det trygt å avvise nullhypotesen om at det ikke er noen forskjell mellom middel. Befolkningssettet har iboende forskjeller, og de er ikke tilfeldig.

Høydepunkter

  • En t-test er en type inferensiell statistikk som brukes til Ã¥ avgjøre om det er en signifikant forskjell mellom middelverdiene til to grupper, som kan være relatert i visse funksjoner.

– T-testen er en av mange tester som brukes til hypotesetesting i statistikk.

– Det er flere forskjellige typer t-test som kan utføres avhengig av data og type analyse som kreves.

– Å beregne en t-test krever tre nøkkeldataverdier. De inkluderer forskjellen mellom gjennomsnittsverdiene fra hvert datasett (kalt gjennomsnittlig forskjell), standardavviket for hver gruppe og antall dataverdier for hver gruppe.