Statistisk signifikans
Vad Àr statistisk signifikans?
Statistisk signifikans avser pÄstÄendet att en uppsÀttning observerade data inte Àr resultatet av slumpen utan istÀllet kan hÀnföras till en specifik orsak. Statistisk signifikans Àr viktig för akademiska discipliner eller praktiker som Àr mycket beroende av att analysera data och forskning, sÄsom ekonomi, finans,. investeringar,. medicin, fysik och biologi.
Statistisk signifikans kan anses vara stark eller svag. NÀr man analyserar en datamÀngd och gör de nödvÀndiga testerna för att urskilja om en eller flera variabler har en effekt pÄ ett utfall, hjÀlper stark statistisk signifikans till att stödja det faktum att resultaten Àr verkliga och inte orsakade av tur eller slump. Enkelt uttryckt, om ett p-vÀrde Àr litet sÄ anses resultatet vara mer tillförlitligt.
Problem uppstÄr i tester av statistisk signifikans eftersom forskare vanligtvis arbetar med urval av större populationer och inte populationerna sjÀlva. Som ett resultat av detta mÄste urvalen vara representativa för populationen, sÄ uppgifterna i urvalet fÄr inte vara partiska pÄ nÄgot sÀtt. Inom de flesta vetenskaper, inklusive ekonomi, kan ett resultat anses vara statistiskt signifikant om det har en konfidensnivÄ pÄ 95 % (eller ibland 99 %).
FörstÄ statistisk signifikans
BerĂ€kningen av statistisk signifikans (signifikanstestning) Ă€r föremĂ„l för en viss grad av fel. Ăven om data verkar ha ett starkt samband, mĂ„ste forskare redogöra för möjligheten att en uppenbar korrelation uppstod pĂ„ grund av slumpmĂ€ssig slump eller ett urvalsfel.
Provstorleken Àr en viktig komponent av statistisk signifikans i och med att större prover Àr mindre benÀgna att fÄ utslag. Endast slumpmÀssigt utvalda representativa urval bör anvÀndas vid signifikanstestning. Den nivÄ pÄ vilken man kan acceptera om en hÀndelse Àr statistiskt signifikant kallas signifikansnivÄn.
Forskare anvÀnder ett mÄtt som kallas p-vÀrdet för att bestÀmma statistisk signifikans: om p-vÀrdet faller under signifikansnivÄn Àr resultatet statistiskt signifikant. P-vÀrdet Àr en funktion av medelvÀrdet och standardavvikelserna för dataproverna.
P-vÀrdet anger sannolikheten under vilken det givna statistiska resultatet intrÀffade, förutsatt att slumpen ensam Àr ansvarig för resultatet. Om denna sannolikhet Àr liten kan forskaren dra slutsatsen att nÄgon annan faktor kan vara ansvarig för de observerade uppgifterna.
Motsatsen till signifikansnivÄn, berÀknad som 1 minus signifikansnivÄn, Àr konfidensnivÄn. Det anger graden av tillförlitlighet för att det statistiska resultatet inte intrÀffade av en slump eller av ett urvalsfel. Den sedvanliga konfidensnivÄn i mÄnga statistiska test Àr 95 %, vilket leder till en sedvanlig signifikansnivÄ eller p-vÀrde pÄ 5 %.
"P-hacking" Ă€r metoden att uttömmande jĂ€mföra mĂ„nga olika uppsĂ€ttningar data pĂ„ jakt efter ett statistiskt signifikant resultat. Detta Ă€r föremĂ„l för rapporteringsbias eftersom forskarna bara rapporterar gynnsamma resultat â inte negativa.
SÀrskilda övervÀganden
Statistisk signifikans indikerar inte alltid praktisk signifikans, vilket innebÀr att resultaten inte kan tillÀmpas pÄ verkliga affÀrssituationer. Dessutom kan statistisk signifikans misstolkas nÀr forskare inte anvÀnder sprÄket noggrant i rapporteringen av sina resultat. Det faktum att ett resultat Àr statistiskt signifikant betyder inte att det inte Àr resultatet av slumpen, bara att det Àr mindre sannolikt att det Àr fallet.
Bara för att tvÄ dataserier har en stark korrelation med varandra innebÀr inte orsakssamband. Till exempel Àr antalet filmer dÀr skÄdespelaren Nicolas Cage spelar under ett givet Är mycket starkt korrelerat med antalet oavsiktliga drunkningar i simbassÀnger. Men denna korrelation Àr falsk eftersom det inte finns nÄgra teoretiska orsakskrav som kan göras.
Ett annat problem som kan uppstÄ med statistisk signifikans Àr att tidigare data, och resultaten frÄn dessa data, vare sig de Àr statistiskt signifikanta eller inte, kanske inte speglar pÄgÄende eller framtida förhÄllanden. Vid investeringar kan detta yttra sig i att en prismodell gÄr sönder under tider av finanskris eftersom korrelationerna förÀndras och variabler inte interagerar som vanligt. Statistisk signifikans kan ocksÄ hjÀlpa en investerare att avgöra om en modell för tillgÄngsprissÀttning Àr bÀttre Àn en annan.
Typer av statistisk signifikanstest
Flera typer av signifikanstest anvÀnds beroende pÄ vilken forskning som bedrivs. Till exempel kan tester anvÀndas för ett, tvÄ eller flera dataprover av olika storlekar för medelvÀrden, varianser, proportioner, parade eller oparade data eller olika datafördelningar.
Det finns ocksÄ olika tillvÀgagÄngssÀtt för signifikanstestning, beroende pÄ vilken typ av data som finns tillgÀnglig. Ronald Fisher Àr krediterad för att ha formulerat ett av de mest flexibla tillvÀgagÄngssÀtten, samt att sÀtta normen för signifikans till p < 0,05. Eftersom det mesta av arbetet kan utföras efter att data redan har samlats in, Àr denna metod fortfarande populÀr för kortsiktiga eller ad-hoc forskningsprojekt.
För att bygga vidare pÄ Fishers metod, slutade Jerzy Neyman och Egon Pearson med att utveckla ett alternativt tillvÀgagÄngssÀtt. Denna metod krÀver mer arbete innan data samlas in, men den tillÄter forskare att utforma sin studie pÄ ett sÀtt som kontrollerar sannolikheten att dra falska slutsatser.
Test av nollhypotes
Statistisk signifikans anvĂ€nds i nollhypotestestning dĂ€r forskare försöker stödja sina teorier genom att förkasta andra förklaringar. Ăven om metoden ibland missförstĂ„s, Ă€r den fortfarande den mest populĂ€ra metoden för datatestning inom medicin, psykologi och andra omrĂ„den.
Den vanligaste nollhypotesen Àr att parametern i frÄga Àr lika med noll (typiskt indikerar att en variabel har noll effekt pÄ utfallet av intresse). Om forskare förkastar nollhypotesen med en konfidens pÄ 95 % eller bÀttre kan de hÀvda att ett observerat samband Àr statistiskt signifikant. Nollhypoteser kan ocksÄ testas för lika effekt för tvÄ eller flera alternativa behandlingar.
TvÀrtemot den vanliga missuppfattningen kan en hög nivÄ av statistisk signifikans inte bevisa att en hypotes Àr sann eller falsk. I verkligheten mÀter statistisk signifikans sannolikheten för att ett observerat utfall skulle ha intrÀffat, förutsatt att nollhypotesen Àr sann.
Förkastande av nollhypotesen, Àven om en mycket hög grad av statistisk signifikans aldrig kan bevisa nÄgot, kan bara ge stöd till en existerande hypotes. à andra sidan Àr underlÄtenhet att förkasta en nollhypotes ofta skÀl att avfÀrda en hypotes.
Dessutom kan en effekt vara statistiskt signifikant men ha endast en mycket liten effekt. Till exempel kan det vara statistiskt signifikant att företag som anvÀnder tvÄskikts toalettpapper i sina badrum har mer produktiva anstÀllda, men förbÀttringen av den absoluta produktiviteten för varje arbetare kommer sannolikt att vara minimal.
RĂ€ttelse â 15 maj 2022: Den hĂ€r artikeln har redigerats för att belysa potentiella felaktigheter i signifikanstestning.
Höjdpunkter
- Statistisk signifikans avser pÄstÄendet att ett resultat frÄn data som genererats genom testning eller experiment sannolikt kan hÀnföras till en specifik orsak.
â BerĂ€kningen av statistisk signifikans Ă€r föremĂ„l för en viss grad av fel.
â En hög grad av statistisk signifikans tyder pĂ„ att ett observerat samband sannolikt inte beror pĂ„ slumpen.
â Flera typer av signifikanstest anvĂ€nds beroende pĂ„ vilken forskning som bedrivs.
â Statistisk signifikans kan misstolkas nĂ€r forskare inte anvĂ€nder sprĂ„ket noggrant i rapporteringen av sina resultat.