Statistisk betydning
Hvad er statistisk signifikans?
Statistisk signifikans refererer til påstanden om, at et sæt observerede data ikke er et resultat af tilfældigheder, men i stedet kan tilskrives en bestemt årsag. Statistisk signifikans er vigtig for akademiske discipliner eller praktikere, der er stærkt afhængige af at analysere data og forskning, såsom økonomi, finans,. investering,. medicin, fysik og biologi.
Statistisk signifikans kan betragtes som stærk eller svag. Når man analyserer et datasæt og laver de nødvendige tests for at afgøre, om en eller flere variable har en effekt på et resultat, hjælper stærk statistisk signifikans med at understøtte det faktum, at resultaterne er reelle og ikke er forårsaget af held eller tilfældigheder. Enkelt sagt, hvis en p-værdi er lille, anses resultatet for at være mere pålideligt.
Der opstår problemer i test af statistisk signifikans, fordi forskere normalt arbejder med prøver af større populationer og ikke selve populationerne. Som følge heraf skal stikprøverne være repræsentative for populationen, så dataene i stikprøven må ikke være partiske på nogen måde. I de fleste videnskaber, herunder økonomi, kan et resultat betragtes som statistisk signifikant, hvis det har et konfidensniveau på 95 % (eller nogle gange 99 %).
ForstĂĄ statistisk signifikans
Beregningen af statistisk signifikans (signifikanstestning) er behæftet med en vis grad af fejl. Selvom data ser ud til at have en stærk sammenhæng, skal forskere redegøre for muligheden for, at en tilsyneladende korrelation opstod på grund af tilfældige tilfældigheder eller en stikprøvefejl.
Prøvestørrelsen er en vigtig komponent af statistisk signifikans, idet større prøver er mindre tilbøjelige til at få fluks. Kun tilfældigt udvalgte, repræsentative prøver bør anvendes i signifikanstestning. Det niveau, hvor man kan acceptere, om en hændelse er statistisk signifikant,. er kendt som signifikansniveauet.
Forskere bruger en måling kendt som p-værdien til at bestemme statistisk signifikans: hvis p-værdien falder under signifikansniveauet, så er resultatet statistisk signifikant. P-værdien er en funktion af dataprøvernes middelværdier og standardafvigelser.
P-værdien angiver sandsynligheden for, at det givne statistiske resultat opstod, forudsat at tilfældighed alene er ansvarlig for resultatet. Hvis denne sandsynlighed er lille, kan forskeren konkludere, at en anden faktor kan være ansvarlig for de observerede data.
Det modsatte af signifikansniveauet, beregnet som 1 minus signifikansniveauet, er konfidensniveauet. Det angiver graden af sikkerhed for, at det statistiske resultat ikke opstod tilfældigt eller ved stikprøvefejl. Det sædvanlige konfidensniveau i mange statistiske test er 95 %, hvilket fører til et sædvanligt signifikansniveau eller p-værdi på 5 %.
"P-hacking" er praksis med udtømmende at sammenligne mange forskellige datasæt på jagt efter et statistisk signifikant resultat. Dette er underlagt rapporteringsbias , fordi forskerne kun rapporterer positive resultater – ikke negative.
Særlige overvejelser
Statistisk signifikans indikerer ikke altid praktisk signifikans, hvilket betyder, at resultaterne ikke kan anvendes til virkelige forretningssituationer. Derudover kan statistisk signifikans misfortolkes, når forskere ikke bruger sproget omhyggeligt i rapporteringen af deres resultater. Det faktum, at et resultat er statistisk signifikant, betyder ikke, at det ikke er resultatet af tilfældigheder, blot at det er mindre sandsynligt, at det er tilfældet.
Bare fordi to dataserier har en stærk korrelation med hinanden, indebærer det ikke årsagssammenhæng. For eksempel er antallet af film, hvor skuespilleren Nicolas Cage medvirker i et givet år, meget høj korreleret med antallet af utilsigtede druknede i svømmebassiner. Men denne sammenhæng er falsk , da der ikke er nogen teoretisk kausal påstand, der kan fremsættes.
Et andet problem, der kan opstå med statistisk signifikans, er, at tidligere data og resultaterne fra disse data, uanset om de er statistisk signifikante eller ej, muligvis ikke afspejler igangværende eller fremtidige forhold. Ved investering kan dette vise sig i en prismodel, der går i stykker i tider med finanskrise, da korrelationer ændrer sig, og variabler ikke interagerer som normalt. Statistisk signifikans kan også hjælpe en investor med at skelne, om en aktivprismodel er bedre end en anden.
Typer af statistisk signifikanstest
Der anvendes flere typer signifikanstest afhængigt af den forskning, der udføres. For eksempel kan tests anvendes til en, to eller flere dataprøver af forskellige størrelser for gennemsnit, varianser, proportioner, parrede eller uparrede data eller forskellige datafordelinger.
Der er også forskellige tilgange til signifikanstestning, afhængigt af hvilken type data der er tilgængelig. Ronald Fisher er krediteret for at formulere en af de mest fleksible tilgange, samt at sætte normen for signifikans til p < 0,05. Fordi det meste af arbejdet kan udføres, efter at dataene allerede er blevet indsamlet, forbliver denne metode populær til kortsigtede eller ad hoc-forskningsprojekter.
I et forsøg på at bygge videre på Fishers metode endte Jerzy Neyman og Egon Pearson med at udvikle en alternativ tilgang. Denne metode kræver mere arbejde, før dataene indsamles, men den giver forskere mulighed for at designe deres undersøgelse på en måde, der kontrollerer sandsynligheden for at nå falske konklusioner.
Nulhypotesetestning
Statistisk signifikans bruges i nulhypotesetestning, hvor forskere forsøger at understøtte deres teorier ved at afvise andre forklaringer. Selvom metoden nogle gange misforstås, er den stadig den mest populære metode til datatest inden for medicin, psykologi og andre områder.
Den mest almindelige nulhypotese er, at den pågældende parameter er lig nul (typisk angiver, at en variabel har nul effekt på resultatet af interessen). Hvis forskere afviser nulhypotesen med en konfidens på 95 % eller bedre, kan de hævde, at en observeret sammenhæng er statistisk signifikant. Nulhypoteser kan også testes for effektligheden for to eller flere alternative behandlinger.
I modsætning til populær misforståelse kan et højt niveau af statistisk signifikans ikke bevise, at en hypotese er sand eller falsk. I virkeligheden måler statistisk signifikans sandsynligheden for, at et observeret resultat ville have fundet sted, forudsat at nulhypotesen er sand.
Afvisning af nulhypotesen, selvom en meget høj grad af statistisk signifikans aldrig kan bevise noget, kan kun tilføje støtte til en eksisterende hypotese. På den anden side er manglende afvisning af en nulhypotese ofte grund til at afvise en hypotese.
Derudover kan en effekt være statistisk signifikant, men kun have en meget lille effekt. For eksempel kan det være statistisk signifikant, at virksomheder, der bruger to-lags toiletpapir i deres badeværelser, har mere produktive medarbejdere, men forbedringen i den absolutte produktivitet for hver enkelt arbejder vil sandsynligvis være minimal.
Rettelse – 15. maj 2022: Denne artikel er blevet redigeret for at fremhæve potentielle fejlslutninger i signifikanstestning.
Højdepunkter
Statistisk signifikans refererer til pĂĄstanden om, at et resultat fra data genereret ved test eller eksperimenter sandsynligvis kan tilskrives en bestemt ĂĄrsag.
Beregningen af statistisk signifikans er behæftet med en vis grad af fejl.
En høj grad af statistisk signifikans indikerer, at en observeret sammenhæng sandsynligvis ikke skyldes tilfældigheder.
Der bruges flere typer signifikanstest afhængig af den forskning, der udføres.
Statistisk signifikans kan misfortolkes, nĂĄr forskere ikke bruger sproget omhyggeligt i rapporteringen af deres resultater.