T-próf
Hvað er T-próf?
T-próf er tegund af ályktunartölfræði sem notuð er til að ákvarða hvort það sé marktækur munur á meðaltölum tveggja hópa, sem geta tengst ákveðnum eiginleikum. Það er aðallega notað þegar gagnasettin, eins og gagnasettið sem skráð er sem niðurstaðan af því að fletta mynt 100 sinnum, myndi fylgja eðlilegri dreifingu og gætu haft óþekkt frávik. T-próf er notað sem tilgátuprófunartæki, sem gerir kleift að prófa forsendur sem eiga við þýði.
T-próf skoðar t-tölfræðina, t-dreifingargildin og frelsisgráðurnar til að ákvarða tölfræðilega marktekt. Til að framkvæma próf með þremur eða fleiri aðferðum verður að nota dreifnigreiningu.
Útskýrir T-prófið
Í meginatriðum gerir t-próf okkur kleift að bera saman meðalgildi gagnasafnanna tveggja og ákvarða hvort þau komu frá sama þýði. Í ofangreindum dæmum, ef við myndum taka úrtak af nemendum úr bekk A og annað úrtak nemenda úr bekk B, myndum við ekki búast við að þeir hefðu nákvæmlega sama meðaltal og staðalfrávik. Á sama hátt ættu sýni sem tekin eru úr samanburðarhópnum sem fengu lyfleysu og þau sem tekin eru úr hópnum sem ávísað var lyfi að hafa aðeins mismunandi meðaltal og staðalfrávik.
Stærðfræðilega tekur t-prófið sýnishorn úr hverju settanna tveggja og setur vandamálasetninguna með því að gera ráð fyrir núlltilgátu um að meðaltölin tvö séu jöfn. Út frá gildandi formúlum eru ákveðin gildi reiknuð út og borin saman við staðalgildin og fyrirhuguð núlltilgáta er samþykkt eða henni hafnað í samræmi við það.
Ef núlltilgátan er hæf til að vera hafnað gefur það til kynna að gagnalestur sé sterkur og sé líklega ekki tilviljunarkenndur.
T-prófið er aðeins eitt af mörgum prófum sem notuð eru í þessu skyni. Tölfræðifræðingar verða að auki að nota önnur próf en t-prófið til að skoða fleiri breytur og próf með stærri úrtaksstærð. Fyrir stórt úrtak nota tölfræðingar z-próf. Aðrir prófunarvalkostir eru kí-kvaðratprófið og f-prófið.
Það eru þrjár tegundir af t-prófum og eru þau flokkuð sem háð og óháð t-próf.
Óljósar prófunarniðurstöður
Íhuga að lyfjaframleiðandi vilji prófa nýuppfundið lyf. Það fylgir hefðbundinni aðferð að prófa lyfið á einum hópi sjúklinga og gefa öðrum hópi lyfleysu, sem kallast viðmiðunarhópur. Lyfleysan sem viðmiðunarhópnum er gefin er efni sem hefur ekki ætlað meðferðargildi og þjónar sem viðmið til að mæla hvernig hinn hópurinn, sem fær raunverulega lyfið, bregst við.
Eftir lyfjaprófið sögðu meðlimir samanburðarhópsins sem fengu lyfleysu að meðalævilengd hefði aukist um þrjú ár, en meðlimir hópsins sem fá ávísað nýja lyfinu segja frá aukningu á meðallífslíkum um fjögur ár. Tafarlaus athugun getur bent til þess að lyfið sé örugglega að virka þar sem árangurinn er betri fyrir hópinn sem notar lyfið. Hins vegar er einnig mögulegt að athugunin sé vegna tilviljunarkenndra atvika, sérstaklega óvæntra heppni. T-próf er gagnlegt til að álykta hvort niðurstöðurnar séu í raun og veru réttar og eiga við um allt þýðið.
Í skóla fengu 100 nemendur í A bekk að meðaltali 85% með 3% staðalfráviki. Aðrir 100 nemendur sem tilheyra B bekk fengu 87% að meðaltali með 4% staðalfráviki. Þó að meðaltal B-bekkjar sé betra en A-bekkjar er kannski ekki rétt að draga þá ályktun að heildarframmistaða nemenda í B-deild sé betri en nemenda í A-flokki. Þetta er vegna þess að það er náttúrulegur breytileiki. í prófum í báðum flokkum, þannig að munurinn gæti stafað af tilviljunum einum saman. T-próf getur hjálpað til við að ákvarða hvort einn flokkur hafi staðið sig betur en hinn.
Forsendur T-prófs
Fyrsta forsendan sem gefin er varðandi t-próf varðar mælikvarða. Forsenda t-prófs er sú að mælikvarðinn sem notaður er á gögnin sem safnað er fylgi samfelldum eða raðarkvarða, svo sem stigum fyrir greindarpróf.
Önnur forsendan sem gefin er út er sú að um einfalt slembiúrtak sé að ræða að gögnunum sé safnað frá dæmigerðum, handahófsvalnum hluta heildarþýðisins.
Þriðja forsendan er gögnin, þegar þau eru teiknuð, leiða til normaldreifingar, bjöllulaga dreifingarferil.
Lokaforsenda er einsleitni dreifni. Einsleitt, eða jafnt, dreifni er til staðar þegar staðalfrávik sýna eru um það bil jöfn.
Reikna T-próf
Til að reikna út t-próf þarf þrjú lykilgagnagildi. Þær innihalda mismun á meðalgildum hvers gagnasetts (kallað meðalmunur), staðalfrávik hvers hóps og fjölda gagnagilda hvers hóps.
Niðurstaða t-prófsins framleiðir t-gildið. Þetta reiknaða t-gildi er síðan borið saman við gildi sem fæst úr töflu um mikilvæga gildi (kölluð T-dreifingartafla). Þessi samanburður hjálpar til við að ákvarða áhrif tilviljunar eingöngu á mismuninn og hvort munurinn sé utan þess tilviljunarsviðs. T-prófið spyr hvort munurinn á hópunum tákni sannan mun á rannsókninni eða hvort það sé hugsanlega tilgangslaus tilviljunarkenndur munur.
T-dreifingartöflur
T-dreifingartaflan er fáanleg í eins- og tvíhala sniði. Hið fyrra er notað til að meta tilvik sem hafa fast gildi eða svið með skýrri stefnu (jákvæð eða neikvæð). Til dæmis, hverjar eru líkurnar á því að úttaksgildi haldist undir -3, eða fái meira en sjö þegar teningpar er kastað? Hið síðarnefnda er notað fyrir sviðsbundna greiningu, svo sem að spyrja hvort hnitin falli á milli -2 og +2.
Útreikningana er hægt að framkvæma með stöðluðum hugbúnaðarforritum sem styðja nauðsynlegar tölfræðiaðgerðir eins og þær sem finnast í MS Excel.
T-gildi og frelsisgráður
T-prófið framleiðir tvö gildi sem úttak sitt: t-gildi og frelsisgráður. T-gildið er hlutfall af mismun milli meðaltals úrtakssettanna tveggja og breytileikans sem er innan úrtakssettanna. Þó að teljaragildið (munurinn á meðaltali sýnishornanna tveggja) sé einfalt að reikna út, getur nefnarinn (breytileikinn sem er til innan úrtakssettanna) orðið dálítið flókinn eftir því hvers konar gagnagildi um ræðir. Nefnari hlutfallsins er mæling á dreifingu eða breytileika. Hærri gildi t-gildisins, einnig kallað t-stig, benda til þess að mikill munur sé á milli úrtakssettanna tveggja. Því minna sem t-gildið er, því meiri líkindi er á milli sýnishópanna tveggja.
Stórt t-stig gefur til kynna að hóparnir séu ólíkir.
Lítið t-stig gefur til kynna að hóparnir séu svipaðir.
Með frelsisgráðum er átt við þau gildi í rannsókn sem hefur frelsi til að vera mismunandi og eru nauðsynleg til að meta mikilvægi og réttmæti núlltilgátunnar. Útreikningur þessara gilda fer venjulega eftir fjölda gagnaskráa sem eru tiltækar í sýnishorninu.
Tengt (eða parað) T-próf
Tengt t-prófið er framkvæmt þegar sýnin samanstanda venjulega af pörum af svipuðum einingum, eða þegar tilvik eru um endurteknar mælingar. Til dæmis geta verið dæmi um að sömu sjúklingarnir hafi verið prófaðir ítrekað - áður en og eftir að hafa fengið tiltekna meðferð. Í slíkum tilvikum er hver sjúklingur notaður sem viðmiðunarsýni gegn sjálfum sér.
Þessi aðferð á einnig við um tilvik þar sem sýnin tengjast á einhvern hátt eða hafa samsvarandi eiginleika, eins og samanburðargreiningu þar sem börn, foreldrar eða systkini taka þátt. Fylgni eða pöruð t-próf eru háð, þar sem um er að ræða tilvik þar sem sýnishornin tvö eru tengd.
Formúlan til að reikna út t-gildi og frelsisgráður fyrir parað t-próf er:
<span class="katex-html" aría -hidden="true">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="mord"><span class="vlist-r" ="vlist" style="height:5.175520000000001em;">>< span class="vlist-t vlist-t2">T=< /span>(n)
c-2.7,0,-7.17,-2.7,-13.5,-8c-5.8,-5.3,-9.5,-10,-9.5,-14
c0,-2,0,3,-3,3,1,-4c1,3,-2,7,23,83,-20,7,67,5,-54
c44.2,-33.3,65.8,-50.3,66.5,-51c1.3,-1.3,3,-2,5,-2c4.7,0,8.7,3.3,12,10
s173,378,173,378c0,7,0,35,3,-71,104,-213c68,7,-142,137,5,-285,206,5,-429
c69,-144,104,5,-217,7,106,5,-221
l0 -0
c5.3,-9.3,12,-14,20,-14
H400000v40H845.2724
s-225.272.467,-225.272,467s-235.486,-235.486c-2.7,4.7,-9,7,-19,7
c-6,0,-10,-1,-12,-3s-194,-422,-194,-422s-65,47,-65,47z
M834 80h400000v40h-400000z'/> s(</ span>diff)</ span> </ span>mean1−mean2< span class="vlist-s"></ span>hvar:< /span>mean 1 og mean2</ span>=Meðalgildi hvers úrtakssettas(diff )=Staðalfrávik munarins á pöruðu gagnagildunum n< span class="mrel">=Úttaksstærð (fjöldi paramismuna)n−1=Frelsisgráðurnar
Hinar tvær tegundir tilheyra óháðu t-prófunum. Sýnishorn af þessum gerðum eru valin óháð hvert öðru - það er að gagnasöfnin í hópunum tveimur vísa ekki til sömu gilda. Þau fela í sér tilvik eins og hópi 100 sjúklinga sem er skipt í tvö sett af 50 sjúklingum hvor. Annar hópanna verður viðmiðunarhópur og fær lyfleysu, en hinn hópurinn fær þá meðferð sem ávísað er. Þetta eru tveir óháðir úrtakshópar sem eru óparaðir hver við annan.
Jafnt frávik (eða sameinað) T-próf
Jafndreifni t-prófið er notað þegar fjöldi sýna í hverjum hópi er sá sami, eða dreifni gagnasafnanna tveggja er svipað. Eftirfarandi formúla er notuð til að reikna út t-gildi og frelsisgráður fyrir jafndreifni t-próf:
l0 -0
c4,-6.7,10,-10,18,-10 H400000v40
H1013.1s-83.4,268,-264.1,840c-180.7.572,-277.876.3,-289.913c-4.7,4.7,-12.7,7,-24,7
s-12,0,-12,0c-1,3,-3,3,-3,7,-11,7,-7,-25c-35,3,-125,3,-106,7,-373,3,-214,-744
c-10,12,-21,25,-33,39s-32,39,-32,39c-6,-5,3,-15,-14,-27,-26s25,-30,25,-30
c26.7,-32.7,52,-63,76,-91s52,-60,52,-60s208,722,208,722
c56,-175,3,126,3,-397,3,211,-666c84,7,-268,7,153,8,-488,2,207,5,-658,5
c53.7,-170.3,84.5,-266.8,92.5,-289.5z
M1001 80h400000v40h-400000z'/> < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< span class="mord mathnormal">ean2þar sem:< /span>mea< span class="mord mathnormal">n1 og </ span>mean2< span class="mspace" style="margin-right:0.27777777777777778em;">=Meðalgildi hvers< span class="mord text">af sýnishornssettunum< span class="psrut" style="height:3.32144em;">var 1 og var2= Frávik hvers sýnishópsn1 og n2= Fjöldi skráa í hverju sýnishorni</ span>
og,
Ójöfn dreifni T-próf
Ójöfn dreifni t-prófið er notað þegar fjöldi sýna í hverjum hópi er mismunandi og dreifni gagnasafnanna tveggja er einnig mismunandi. Þetta próf er einnig kallað Welch's t-próf. Eftirfarandi formúla er notuð til að reikna út t-gildi og frelsisgráður fyrir ójöfn dreifni t-próf:
< /span>>T-gildi< /span>=>< span class="vlist-r">( n1 var 1 >< /span>+< span class="mfrac"><span class="mord mtight" ">n2< /span>var2 )
c339.3,-1799.3,509.3,-2700,510,-2702 l0 -0
c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7
s-90,5,478,-276,2,1466c-185,7,988,-279,5,1483,-281,5,1485c-2,6,-10,9,-24,9
c-8,0,-12,-0,7,-12,-2c0,-1,3,-5,3,-32,-16,-92c-50,7,-293,3,-119,7,-693,3,-207,-1200
c0,-1,3,-5,3,8,7,-16,30c-10,7,21,3,-21,3,42,7,-32,64s-16,33,-16,33s-26,-26,-26,-26
s76,-153,76,-153s77,-151,77,-151c0.7,0.7,35.7,202,105,604c67.3,400.7,102,602.7,104,
606zM1001 80h400000v40H1017.7z'/> < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< span class="mord mathnormal">ean2 span class="vlist" style="height:2.93em;"></ span>þar sem: mea n1 og < /span>mean2=Meðalgildi hvers af sýnishornssettunumvar1 og v ar2=</ span>Frávik hvers sýnatökusetta<span class="mord" mord mathnormal">n1 og n2=Fjöldi skráa í hverju úrtakssetti
og,
< span class="katex-html" aria-hidden="true">< /span> </sp an>Frelsisgráður< /span>= </ span>n1< /span>−1< /span>( <span class="mord mathnormal mtight" ">n1 < span class="psrut" style="height:3em;">var1< span class="vlist-r">2)<span style=="pstrut" "height:2.5em;">2</ span></ span>+n2−1</ span>(< span class="mord mtight">n2< /span>var< /span>22 >< /span>) 2< /span> <span class="pstrut" stíll ="height:3.58523em;">(n1var1>< span class="vlist-r">2</ span>< /span>< /span>+ n2< /span><span class="frac-line" stíll ="border-bottom-width:0.04em;"> v span>ar<span class="mord mtight" ">2</ span>2 )2 <span class="mord" mord text">þar sem:var< span class="mord">1 og var span>2=</ span>Frávik hvers sýnishornssettsn1 og < span class="mord mathnormal">n2< span class="mrel">=Fjöldi skráa í hverju úrtakssetti</ span>
Ákvörðun um rétta T-prófið sem á að nota
Hægt er að nota eftirfarandi flæðirit til að ákvarða hvaða t-próf ætti að nota út frá eiginleikum sýnishópanna. Lykilatriðin sem taka þarf til athugunar eru hvort sýnishornsskrárnar séu svipaðar, fjöldi gagnaskráa í hverju sýnistaki og frávik hvers sýnishóps.
Ójöfn dreifni T-próf dæmi
Gerum ráð fyrir að við séum að taka skámælingu á málverkum sem berast í listasafni. Í öðrum hópi sýnishorna eru 10 málverk en í hinum eru 20 myndir. Gagnasöfnin, með samsvarandi meðal- og dreifnigildum, eru sem hér segir:
TTT
Þó meðaltalið í setti 2 sé hærra en í setti 1, getum við ekki komist að þeirri niðurstöðu að þýðið sem samsvarar setti 2 hafi hærra meðaltal en þýðið sem samsvarar setti 1. Er munurinn frá 19,4 til 21,6 vegna tilviljunar eingöngu, eða geri það. er raunverulega munur á heildarfjölda allra málverka sem berast í listasafninu? Við komumst að vandamálinu með því að gera ráð fyrir núlltilgátunni að meðaltalið sé það sama á milli tveggja úrtakssettanna og gerum t-próf til að prófa hvort tilgátan sé trúverðug.
Þar sem fjöldi gagnaskráa er mismunandi (n1 = 10 og n2 = 20) og dreifingin er einnig mismunandi, eru t-gildi og frelsisgráður reiknaðar fyrir ofangreind gagnamengi með formúlunni sem nefnd er í T-prófinu fyrir ójafna dreifni. kafla.
T-gildið er -2,24787. Þar sem hægt er að hunsa mínusmerkið þegar t-gildin tvö eru borin saman er reiknað gildi 2,24787.
Frelsisstigsgildið er 24,38 og er lækkað niður í 24, vegna formúluskilgreiningarinnar sem krefst námundunar niður á gildið að minnsta mögulega heiltölugildi.
Hægt er að tilgreina líkindastig (alfastig, marktektarstig, p) sem viðmið fyrir samþykki. Í flestum tilfellum má gera ráð fyrir 5% gildi.
Með því að nota frelsisgildið sem 24 og 5% marktektarstig gefur t-gilda dreifingartöfluna gildið 2,064. Ef þetta gildi er borið saman við reiknað gildi 2,247 gefur til kynna að reiknað t-gildi sé hærra en töflugildið með 5% marktækni. Því er óhætt að hafna núlltilgátunni um að enginn munur sé á meðaltölum. Íbúahópurinn hefur innri munur og hann er ekki tilviljun.
Hápunktar
T-próf er tegund af ályktunartölfræði sem notuð er til að ákvarða hvort marktækur munur sé á meðaltölum tveggja hópa, sem geta tengst ákveðnum eiginleikum.
T-prófið er eitt af mörgum prófum sem notuð eru í þeim tilgangi að prófa tilgátu í tölfræði.
Það eru nokkrar mismunandi gerðir af t-prófum sem hægt er að framkvæma eftir gögnum og gerð greiningar sem krafist er.
Til að reikna út t-próf þarf þrjú lykilgagnagildi. Þær innihalda mismun á meðalgildum hvers gagnasetts (kallað meðalmunur), staðalfrávik hvers hóps og fjölda gagnagilda hvers hóps.