T-testi

Mikä on T-testi?

T-testi on eräänlainen päättelytilasto, jota käytetään määrittämään, onko kahden ryhmän keskiarvojen välillä merkittävää eroa, joka voi liittyä tiettyihin piirteisiin . Sitä käytetään enimmäkseen, kun tietojoukot, kuten kolikon 100-kertaisesta heittämisestä kirjattu tietojoukko, noudattaisivat normaalijakaumaa ja niillä saattaa olla tuntemattomia varianssia. T-testiä käytetään hypoteesien testaustyökaluna, jonka avulla voidaan testata populaatioon soveltuvaa oletusta.

T-testissä tarkastellaan t-tilastoa, t-jakauman arvoja ja vapausasteita tilastollisen merkitsevyyden määrittämiseksi. Testin suorittamiseksi kolmella tai useammalla keinolla on käytettävä varianssianalyysiä.

T-testin selittäminen

Pohjimmiltaan t-testin avulla voimme verrata kahden tietojoukon keskiarvoja ja määrittää, ovatko ne peräisin samasta populaatiosta. Jos ottaisimme yllä olevissa esimerkeissä otoksen A-luokan opiskelijoista ja toisen luokan B opiskelijoista, emme odottaisi, että heillä olisi täsmälleen sama keskiarvo ja keskihajonta. Samoin lumelääkettä saaneesta kontrolliryhmästä ja lääkemääräystä saaneesta ryhmästä otetuilla näytteillä tulisi olla hieman erilainen keskiarvo ja keskihajonnan taso.

Matemaattisesti t-testi ottaa näytteen kummastakin kahdesta joukosta ja määrittää ongelman oletuksen olettamalla nollahypoteesi, että nämä kaksi keskiarvoa ovat yhtä suuret. Soveltuvien kaavojen perusteella lasketaan tietyt arvot ja verrataan niitä standardiarvoihin, ja oletettu nollahypoteesi hyväksytään tai hylätään vastaavasti.

Jos nollahypoteesi kelpuutetaan hylättäväksi, se osoittaa, että datalukemat ovat vahvoja eivätkä todennäköisesti johdu sattumasta.

T-testi on vain yksi monista tähän tarkoitukseen käytetyistä testeistä. Tilastotyöntekijöiden on lisäksi käytettävä muita testejä kuin t-testiä tutkiakseen enemmän muuttujia ja testejä suuremmalla otoskoolla. Suurelle otokselle tilastotieteilijät käyttävät z-testiä. Muita testausvaihtoehtoja ovat khin neliötesti ja f-testi.

T-testejä on kolmen tyyppisiä, ja ne luokitellaan riippuviksi ja riippumattomiksi t-testeiksi.

Epäselvät testitulokset

Ajattele, että lääkevalmistaja haluaa testata vasta keksittyä lääkettä. Se noudattaa standardimenettelyä, jossa lääkettä kokeillaan yhdelle potilasryhmälle ja lumelääkettä annetaan toiselle ryhmälle, jota kutsutaan kontrolliryhmäksi. Kontrolliryhmälle annettu lumelääke on aine, jolla ei ole tarkoitettua terapeuttista arvoa, ja se toimii vertailukohtana sen mittaamiseen, miten toinen ryhmä, jolle varsinaista lääkettä annetaan, reagoi.

Lääkekokeen jälkeen lumelääkettä saaneiden kontrolliryhmän jäsenten keskimääräinen elinajanodote piti kolmella vuodella, kun taas uutta lääkettä saaneiden ryhmän jäsenten keskimääräinen elinajanodote pitenee neljällä vuodella. Välitön havainnointi voi osoittaa, että lääke todella toimii, koska tulokset ovat parempia lääkettä käyttävälle ryhmälle. On kuitenkin myös mahdollista, että havainto voi johtua sattumasta, varsinkin yllättävästä onnenpalasta. T-testi on hyödyllinen päätettäessä, ovatko tulokset todella oikeita ja soveltuvatko koko populaatioon.

Koulussa 100 A-luokan oppilasta sai keskimäärin 85 % pisteen keskihajonnan ollessa 3 %. Toiset 100 B-luokkaan kuuluvaa oppilasta saivat keskimäärin 87 % keskihajonnan ollessa 4 %. Vaikka luokan B keskiarvo on parempi kuin luokan A, ei ehkä ole oikein tehdä johtopäätös, että B-luokan oppilaiden kokonaissuoritus on parempi kuin luokan A oppilaiden. Tämä johtuu siitä, että siellä on luonnollista vaihtelua. koetuloksissa molemmissa luokissa, joten ero voi johtua pelkästään sattumasta. T-testi voi auttaa määrittämään, menestyikö yksi luokka paremmin kuin toinen.

T-testin oletukset

Ensimmäinen t-testejä koskeva oletus koskee mittausasteikkoa. T-testin oletuksena on, että kerättyyn dataan sovellettu mittausasteikko seuraa jatkuvaa tai järjestysasteikkoa, kuten IQ-testin pisteet.
Toinen tehty oletus on yksinkertainen satunnaisotos, jonka mukaan tiedot kerätään edustavalta, satunnaisesti valitulta osalta kokonaisväestöä.
Kolmas oletus on, että data, kun se piirretään, johtaa normaalijakaumaan, kellon muotoiseen jakautumiskäyrään.
Lopullinen oletus on varianssin homogeenisuus. Homogeeninen tai yhtä suuri varianssi on olemassa, kun näytteiden keskihajonnat ovat suunnilleen yhtä suuret.

T-testien laskeminen

T-testin laskeminen vaatii kolme avaintietoarvoa. Ne sisältävät kunkin tietojoukon keskiarvojen välisen eron (kutsutaan keskimääräiseksi eroksi), kunkin ryhmän keskihajonnan ja kunkin ryhmän tietoarvojen lukumäärän.

T-testin tulos tuottaa t-arvon. Tätä laskettua t-arvoa verrataan sitten arvoon, joka on saatu kriittisten arvojen taulukosta (kutsutaan T-jakaumataulukoksi). Tämä vertailu auttaa määrittämään pelkän sattuman vaikutuksen eroon ja onko ero tuon sattuma-alueen ulkopuolella. T-testi kyseenalaistaa, edustaako ryhmien välinen ero todellista eroa tutkimuksessa vai onko se mahdollisesti merkityksetön satunnainen ero.

T-jakelutaulukot

T-jakotaulukko on saatavana yksi- ja kaksipyrstöinä. Ensin mainittua käytetään arvioitaessa tapauksia, joilla on kiinteä arvo tai vaihteluväli, jolla on selkeä suunta (positiivinen tai negatiivinen). Mikä on esimerkiksi todennäköisyys, että lähtöarvo jää alle -3:n tai saa yli seitsemän noppaa heittäessä? Jälkimmäistä käytetään aluerajaan analyysiin, kuten kysytään, ovatko koordinaatit välillä -2 ja +2.

Laskelmat voidaan suorittaa vakioohjelmistoilla, jotka tukevat tarvittavia tilastotoimintoja, kuten MS Excelissä.

T-arvot ja vapausasteet

T-testi tuottaa kaksi arvoa ulostulokseen: t-arvon ja vapausasteet. t-arvo on kahden näytejoukon keskiarvon ja näytejoukoissa esiintyvän vaihtelun välisen eron suhde. Vaikka osoittajan arvo (kahden näytejoukon keskiarvon ero) on yksinkertaista laskea, nimittäjä (näytejoukoissa esiintyvä vaihtelu) voi tulla hieman monimutkaiseksi riippuen kyseessä olevien data-arvojen tyypistä. Suhteen nimittäjä on dispersion tai vaihtelun mitta. Suuremmat t-arvon arvot, joita kutsutaan myös t-pisteiksi, osoittavat, että näiden kahden näytejoukon välillä on suuri ero. Mitä pienempi t-arvo on, sitä enemmän samankaltaisuutta näiden kahden näytejoukon välillä on.

Suuri t-piste osoittaa, että ryhmät ovat erilaisia.
Pieni t-piste osoittaa, että ryhmät ovat samanlaisia.

Vapausasteet viittaavat tutkimuksessa oleviin arvoihin, joilla on vapaus vaihdella ja jotka ovat olennaisia arvioitaessa nollahypoteesin tärkeyttä ja pätevyyttä. Näiden arvojen laskeminen riippuu yleensä näytejoukossa käytettävissä olevien tietueiden lukumäärästä.

Korreloitu (tai parillinen) T-testi

Korreloitu t-testi suoritetaan, kun näytteet koostuvat tyypillisesti samanlaisten yksiköiden yhteensovitetuista pareista tai kun on tapauksia, joissa mittauksia on toistettu. Saattaa esimerkiksi olla tapauksia, joissa samoja potilaita testataan toistuvasti – ennen tietyn hoidon saamista ja sen jälkeen. Tällaisissa tapauksissa jokaista potilasta käytetään kontrollinäytteenä itseään vastaan.

Tämä menetelmä soveltuu myös tapauksiin, joissa näytteet liittyvät jollakin tavalla toisiinsa tai niillä on yhteensopivia ominaisuuksia, kuten vertailevassa analyysissä, jossa on mukana lapsia, vanhempia tai sisaruksia. Korreloidut tai parilliset t-testit ovat riippuvaisia tyyppejä, koska ne koskevat tapauksia, joissa kaksi näytesarjaa liittyvät toisiinsa.

Kaava t-arvon ja vapausasteiden laskemiseksi parilliseen t-testiin on:

$\begin{aligned} T = \frac{keskiarvo 1 - keskiarvo 2}{< mfrac>} \\ < /mstyle> & missä: \\ keskiarvo 1 ja keskiarvo 2 =</ mo>Kunkin näytejoukon keskiarvot \\ s</ mi>(diff)=Keskipoikkeama parillisten data-arvojen eroista \\ n = Otoksen koko (parillisten erojen määrä) \\ </mr ow> & n -</ mo>1=Vapausasteet \end{aligned} < annotation encoding="application/x-tex">\begin&T=\frac{\textit1 - \textit2}{\frac{s(\text)} {\sqrt{(n)}}}\&\textbf\&\textit1\text\textit2=\text{Kummankin keskiarvot näytejoukkoista}\&s(\text)=\text\&n=\text{Otoskoko (parien määrä erot)}\&n-1=\text\end$ < jänneväli class="vlist-t vlist-t2">T=(n)<svg width='400em' height='1.5428571428571431em' viewBox='0 0 400000 1080' keepAspectRatio='xMinYMin sd,7'2'><MinYMin

c-2,7,0,-7,17,-2,7,-13,5,-8c-5,8,-5,3,-9,5,-10,-9,5,-14

c0,-2,0.3,-3.3,1,-4c1.3,-2.7,23.83,-20.7,67.5,-54

c44.2,-33.3,65.8,-50.3,66.5,-51c1.3,-1.3,3,-2,5,-2c4.7,0,8.7,3.3,12,10

s173,378,173,378c0.7,0,35.3,-71,104,-213c68.7,-142,137.5,-285,206.5,-429

c69,-144,104.5,-217.7,106.5,-221

l0-0

c5.3,-9.3,12,-14,20,-14

H400000v40H845.2724

s-225.272,467,-225.272,467s-235,486,-235,486c-2.7,4.7,-9,7,-19,7

c-6,0,-10,-1,-12,-3s-194,-422,-194,-422s-65,47,-65,47z

M834 80h400000v40h-400000z'/> s(</) span>diff) keskiarvo1−mean2missä:tarkoittaa 1 ja mean2</. span>=Kunkin näytejoukon keskiarvots(diff )=Parillisten data-arvojen erojen keskihajonta n=Otoksen koko (parillisten erojen määrä)n−1=Vapausasteet

Loput kaksi tyyppiä kuuluvat riippumattomiin t-testeihin. Näiden tyyppien näytteet valitaan toisistaan riippumatta – eli kahden ryhmän tietojoukot eivät viittaa samoihin arvoihin. Ne sisältävät tapauksia, kuten 100 potilaan ryhmä, joka on jaettu kahteen 50 potilaan ryhmään. Toisesta ryhmästä tulee kontrolliryhmä ja hänelle annetaan lumelääkettä, kun taas toinen ryhmä saa määrättyä hoitoa. Tämä muodostaa kaksi itsenäistä näyteryhmää, jotka eivät ole parita keskenään.

Equal Variance (tai Pooled) T-testi

Saman varianssin t-testiä käytetään, kun näytteiden määrä kussakin ryhmässä on sama tai kahden tietojoukon varianssi on samanlainen. Saman varianssin t-testin t-arvon ja vapausasteiden laskemiseen käytetään seuraavaa kaavaa:

$\begin&\teksti = \frac{ keskiarvo1 - keskiarvo2 }{\frac {(n1 - 1) \times var1$

l0-0

c4,-6.7,10,-10,18,-10 H400000v40

H1013.1s-83.4,268,-264.1,840c-180.7,572,-277,876,3,-289,913c-4,7,4,7,-12,7,7,-24,7

s-12,0,-12,0c-1,3,-3,3,-3,7,-11,7,-7,-25c-35,3,-125,3,-106,7,-373,3,-214,-744

c-10,12,-21,25,-33,39s-32,39,-32,39c-6,-5.3,-15,-14,-27,-26s25,-30,25,-30

c26.7,-32.7,52,-63,76,-91s52,-60,52,-60s208,722,208,722

c56,-175.3,126.3,-397.3,211,-666c84.7,-268.7,153.8,-488.2,207.5,-658.5

c53.7,-170.3,84.5,-266.8,92.5,-289.5z

M1001 80h400000v40h-400000z'/> mean1−mean2missä:mean1 ja mean2=Kunkin keskiarvotnäytesarjoistavar 1 ja var2= Kunkin näytejoukon varianssin1 ja n2= Tietueiden lukumäärä kussakin näytejoukossa

ja,

$\begin &\text = n1 + n2 - 2 \ &\textbf\ &n1 \text n2 = \text{Tietueiden lukumäärä kussakin esimerkkijoukossa} \ \end$

Epätasaisen varianssin T-testi

Epätasaisen varianssin t-testiä käytetään, kun näytteiden lukumäärä kussakin ryhmässä on erilainen, ja myös kahden tietojoukon varianssi on erilainen. Tätä testiä kutsutaan myös Welchin t-testiksi. Seuraavaa kaavaa käytetään t-arvon ja vapausasteiden laskemiseen epätasaisen varianssin t-testille:

$\begin&\text =\frac{\sqrt{\bigg(\frac{+\frac\bigg)}}}\&\textbf \&keskiarvo1 \teksti keskiarvo2 = \teksti \&\teksti{näytejoukkojen} \&var1 \teksti var2 = \teksti \&n1 \teksti n2 = \teksti{Tietueiden lukumäärä kussakin esimerkkijoukossa} \end$

c339.3,-1799.3,509.3,-2700,510,-2702 l0 -0

c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7

s-90.5,478,-276.2,1466c-185.7,988,-279.5,1483,-281.5,1485c-2,6,-10,9,-24,9

c-8,0,-12,-0.7,-12,-2c0,-1.3,-5.3,-32,-16,-92c-50.7,-293.3,-119.7,-693.3,-207,-1200

c0,-1.3,-5.3,8.7,-16,30c-10.7,21.3,-21.3,42.7,-32,64s-16,33,-16,33s-26,-26,-26,-26

s76,-153,76,-153s77,-151,77,-151c0.7,0.7,35.7,202,105,604c67.3,400.7,102,602.7,104,

606zM1001 80h400000v40H1017.7z'/> mean1−mean2missä: mea n1 ja mean2=Kunkin keskiarvot näytesarjoistavar1 ja v ar2=Kunkin näytejoukon varianssin1 ja n2=Tietueiden lukumäärä kussakin näytejoukossa

ja,

$\begin &\text = \frac{ \left ( \frac{ var1$

Oikean käytettävän T-testin määrittäminen

Seuraavaa vuokaaviota voidaan käyttää määrittämään, mitä t-testiä tulisi käyttää näytejoukkojen ominaisuuksien perusteella. Tärkeitä huomioitavia kohteita ovat, ovatko näytetietueet samankaltaisia, datatietueiden lukumäärä kussakin näytejoukossa ja kunkin näytejoukon varianssi.

Epätasaisen varianssin T-testiesimerkki

Oletetaan, että otamme taidegalleriassa vastaanotettujen maalausten diagonaalimittauksen. Yksi näyteryhmä sisältää 10 maalausta ja toinen 20 maalausta. Tietojoukot ja vastaavat keskiarvot ja varianssiarvot ovat seuraavat:

TTT

Vaikka joukon 2 keskiarvo on suurempi kuin joukon 1, emme voi päätellä, että joukkoa 2 vastaavalla populaatiolla on suurempi keskiarvo kuin joukkoa 1 vastaavalla populaatiolla. Johtuuko ero 19,4:stä 21,6:een pelkästä sattumasta vai ei Onko todella eroja kaikkien taidegalleriaan vastaanotettujen maalausten kokonaispopulaatioissa? Määritämme ongelman olettamalla nollahypoteesin, että keskiarvo on sama kahden näytejoukon välillä, ja teemme t-testin testataksemme, onko hypoteesi uskottava.

Koska tietueiden määrä on erilainen (n1 = 10 ja n2 = 20) ja myös varianssi on erilainen, t-arvo ja vapausasteet lasketaan yllä olevalle tietojoukolle käyttämällä Unequal Variance T-testissä mainittua kaavaa. osio.

T-arvo on -2,24787. Koska miinusmerkki voidaan jättää huomioimatta kahta t-arvoa verrattaessa, laskettu arvo on 2,24787.

Vapausasteiden arvo on 24,38 ja se pienenee 24:ään johtuen kaavan määritelmästä, joka edellyttää arvon pyöristämistä alaspäin pienimpään mahdolliseen kokonaislukuarvoon.

Hyväksymiskriteeriksi voidaan määrittää todennäköisyystaso (alfataso, merkitsevyystaso, p). Useimmissa tapauksissa voidaan olettaa 5 %:n arvo.

Käyttämällä vapausasteen arvoa 24 ja 5 %:n merkitsevyystasoa, t-arvon jakaumataulukon tarkastelu antaa arvon 2,064. Tämän arvon vertaaminen laskettuun arvoon 2,247 osoittaa, että laskettu t-arvo on suurempi kuin taulukon arvo 5 %:n merkitsevyystasolla. Siksi on turvallista hylätä nollahypoteesi, jonka mukaan keskiarvojen välillä ei ole eroa. Populaatiojoukossa on luontaisia eroja, eivätkä ne ole sattumaa.

Kohokohdat

T-testi on eräänlainen päättelytilasto, jota käytetään määrittämään, onko kahden ryhmän keskiarvojen välillä merkittävää eroa, jotka voivat liittyä tiettyihin piirteisiin.
T-testi on yksi monista tilastoissa hypoteesien testaamiseen käytettävistä testeistä.
On olemassa useita erilaisia t-testejä, jotka voidaan suorittaa riippuen tarvittavasta tiedosta ja analyysityypistä.
T-testin laskeminen vaatii kolme avaintietoarvoa. Ne sisältävät kunkin tietojoukon keskiarvojen välisen eron (kutsutaan keskimääräiseksi eroksi), kunkin ryhmän keskihajonnan ja kunkin ryhmän tietoarvojen lukumäärän.