Tölfræðileg marktækni

Hvað er tölfræðileg marktækni?

Tölfræðileg marktækni vísar til fullyrðingarinnar um að mengi mældra gagna sé ekki afleiðing tilviljunar heldur megi rekja til ákveðinnar orsök. Tölfræðileg marktekt er mikilvæg fyrir akademískar greinar eða iðkendur sem reiða sig mikið á að greina gögn og rannsóknir, svo sem hagfræði, fjármál,. fjárfestingar,. læknisfræði, eðlisfræði og líffræði.

Tölfræðileg marktækni getur talist sterk eða veik. Þegar gagnagrunnur er greindur og nauðsynlegar prófanir eru gerðar til að greina hvort ein eða fleiri breytur hafi áhrif á niðurstöðu, hjálpar sterk tölfræðileg marktækni að styðja þá staðreynd að niðurstöðurnar eru raunverulegar og stafa ekki af heppni eða tilviljun. Einfaldlega sagt, ef p-gildi er lítið þá er niðurstaðan talin áreiðanlegri.

Vandamál koma upp í prófum sem hafa tölfræðilega mikilvægi vegna þess að vísindamenn vinna venjulega með sýni úr stærri þýðum en ekki þýðunum sjálfum. Þar af leiðandi verða úrtökin að vera dæmigerð fyrir þýðið, þannig að gögnin sem eru í úrtakinu mega ekki vera hlutdræg á nokkurn hátt. Í flestum vísindum, þar á meðal hagfræði, getur niðurstaða talist tölfræðilega marktæk ef hún hefur 95% öryggi (eða stundum 99%).

Skilningur á tölfræðilegri þýðingu

Útreikningur á tölfræðilegri marktækni (marktektarprófun) er háð ákveðinni skekkju. Jafnvel þótt gögn virðist hafa sterk tengsl verða vísindamenn að gera grein fyrir möguleikanum á því að augljós fylgni hafi komið upp vegna tilviljunarkenndra tilviljunar eða úrtaksvillu.

Stærð sýnis er mikilvægur þáttur í tölfræðilegri þýðingu að því leyti að stærri sýni eru síður viðkvæm fyrir flögum. Aðeins skal nota dæmigerð sýni af handahófi við marktektarpróf. Stigið þar sem hægt er að samþykkja hvort atburður sé tölfræðilega marktækur er þekkt sem marktektarstig.

Vísindamenn nota mælingu sem kallast p-gildi til að ákvarða tölfræðilega marktækni: ef p-gildið fer niður fyrir marktektarstigið, þá er niðurstaðan tölfræðilega marktæk. P-gildið er fall af meðaltölum og staðalfrávikum gagnasýnanna.

P-gildið gefur til kynna líkurnar á því að tiltekin tölfræðileg niðurstaða átti sér stað, að því gefnu að tilviljun ein sé ábyrg fyrir niðurstöðunni. Ef þessar líkur eru litlar, þá getur rannsakandinn komist að þeirri niðurstöðu að einhver annar þáttur gæti verið ábyrgur fyrir gögnunum sem fram komu.

Andstæða marktektarstigsins, reiknað sem 1 mínus marktektarstigið, er öryggisstigið. Það gefur til kynna hversu öruggt er að tölfræðileg niðurstaða hafi ekki átt sér stað fyrir tilviljun eða úrtaksskekkju. Venjulegt öryggisstig í mörgum tölfræðilegum prófum er 95%, sem leiðir til hefðbundins marktektarstigs eða p-gildis upp á 5%.

„P-hacking“ er sú aðferð að bera saman mörg mismunandi gagnasett í leit að tölfræðilega marktækri niðurstöðu. Þetta er háð hlutdrægni í skýrslugerð vegna þess að vísindamenn tilkynna aðeins um hagstæðar niðurstöður - ekki neikvæðar.

Sérstök atriði

Tölfræðileg marktekt gefur ekki alltaf til kynna hagnýta marktekt, sem þýðir að ekki er hægt að nota niðurstöðurnar á raunverulegar viðskiptaaðstæður. Þar að auki getur tölfræðileg marktekt verið rangtúlkuð þegar rannsakendur fara ekki vandlega með tungumálið við að segja frá niðurstöðum sínum. Það að niðurstaða sé tölfræðilega marktæk þýðir ekki að hún sé ekki afleiðing tilviljunar, bara að það sé ólíklegra að svo sé.

Bara vegna þess að tvær gagnaraðir hafa sterka fylgni hver við aðra þýðir ekki orsakasamband. Til dæmis er fjöldi kvikmynda sem leikarinn Nicolas Cage leikur í á tilteknu ári í mjög mikilli fylgni við fjölda drukknana fyrir slysni í sundlaugum. En þessi fylgni er röng þar sem engin fræðileg orsök fullyrðing er hægt að gera.

Annað vandamál sem getur komið upp með tölfræðilega mikilvægi er að fyrri gögn, og niðurstöður úr þeim gögnum, hvort sem þær eru tölfræðilega marktækar eða ekki, endurspegla kannski ekki viðvarandi eða framtíðaraðstæður. Í fjárfestingum getur þetta birst í því að verðlíkan brotnar niður á tímum fjármálakreppu þar sem fylgni breytist og breytur hafa ekki samskipti eins og venjulega. Tölfræðileg marktækni getur einnig hjálpað fjárfesti að greina hvort eitt eignaverðslíkan sé betra en annað.

Tegundir tölfræðilegra marktækniprófa

Nokkrar tegundir marktektarprófa eru notaðar eftir því hvaða rannsóknir eru gerðar. Til dæmis er hægt að nota próf fyrir eitt, tvö eða fleiri gagnasýni af ýmsum stærðum fyrir meðaltöl, frávik, hlutföll, pöruð eða ópöruð gögn eða mismunandi gagnadreifingu.

Það eru líka mismunandi aðferðir við marktektarpróf, allt eftir því hvers konar gögn eru tiltæk. Ronald Fisher er talinn hafa mótað eina af sveigjanlegustu aðferðunum, auk þess að setja normið fyrir marktekt á p < 0,05. Vegna þess að hægt er að vinna megnið af vinnunni eftir að gögnunum hefur þegar verið safnað, er þessi aðferð enn vinsæl fyrir skammtíma eða sérstök rannsóknarverkefni.

Þeir Jerzy Neyman og Egon Pearson reyndu að byggja á aðferð Fisher og enduðu á því að þróa aðra nálgun. Þessi aðferð krefst meiri vinnu áður en gögnunum er safnað, en hún gerir rannsakendum kleift að hanna rannsókn sína á þann hátt að það stýrir líkum á að komast að röngum niðurstöðum.

Núlltilgátuprófun

Tölfræðileg marktekt er notuð í núlltilgátuprófun þar sem vísindamenn reyna að styðja kenningar sínar með því að hafna öðrum skýringum. Þó að aðferðin sé stundum misskilin er hún enn vinsælasta aðferðin við gagnaprófun í læknisfræði, sálfræði og öðrum sviðum.

Algengasta núlltilgátan er sú að viðkomandi færibreyta sé jöfn núlli (sem gefur venjulega til kynna að breyta hafi engin áhrif á niðurstöðu vaxta). Ef vísindamenn hafna núlltilgátunni með 95% öryggi eða betra geta þeir fullyrt að samband sem sést sé tölfræðilega marktækt. Einnig er hægt að prófa núlltilgátur fyrir jöfnum áhrifum fyrir tvær eða fleiri aðrar meðferðir.

Andstætt algengum misskilningi getur hátt stig tölfræðilegrar marktækni ekki sannað að tilgáta sé sönn eða röng. Í raun og veru mælir tölfræðileg marktækni líkurnar á því að niðurstaða sem sést hefði átt sér stað, að því gefnu að núlltilgátan sé sönn.

Höfnun núlltilgátunnar, jafnvel þó að mjög mikil tölfræðileg marktækni geti aldrei sannað eitthvað, getur aðeins bætt stuðningi við tilgátu sem fyrir er. Á hinn bóginn er ekki hægt að hafna núlltilgátu oft ástæða til að hafna tilgátu.

Auk þess geta áhrif verið tölfræðilega marktæk en hafa aðeins mjög lítil áhrif. Til dæmis gæti það verið tölfræðilega marktækt að fyrirtæki sem nota tveggja laga salernispappír á baðherbergin sín séu með afkastameiri starfsmenn, en aukningin í algerri framleiðni hvers starfsmanns er líklega lítil.

Leiðrétting – 15. maí 2022: Þessari grein hefur verið breytt til að varpa ljósi á hugsanlegar villur í marktektarprófum.

Hápunktar

Tölfræðileg marktækni vísar til fullyrðingar um að líklegt sé að niðurstaða úr gögnum sem myndast við prófun eða tilraunir megi rekja til ákveðinnar orsök.
Útreikningur á tölfræðilegri marktækni er háður ákveðinni skekkju.
Mikil tölfræðileg marktækni gefur til kynna að ólíklegt sé að samband sem sést sé vegna tilviljunar.
Nokkrar tegundir marktektarprófa eru notaðar eftir því hvaða rannsóknir eru gerðar.
Tölfræðileg marktækni getur verið rangtúlkuð þegar rannsakendur nota tungumálið ekki vandlega við að segja frá niðurstöðum sínum.