Provvalsbias
Vad är provvalsbias?
Provurvalsbias är en typ av bias som orsakas av att man väljer icke-slumpmässiga data för statistisk analys. Biasen existerar på grund av ett fel i urvalsprocessen, där en delmängd av data systematiskt exkluderas på grund av ett visst attribut. Exkluderingen av delmängden kan påverka testets statistiska signifikans, och det kan påverka skattningarna av parametrarna i den statistiska modellen.
Förstå provvalsbias
Survivorship bias är en vanlig typ av urvalsbias. Denna typ av fördomar ignorerar de ämnen som inte tog sig förbi en viss punkt i urvalsprocessen och fokuserar bara på de ämnen som "överlevde". Detta kan leda till falska slutsatser.
Till exempel, när du backtestar en investeringsstrategi på en stor grupp av aktier, kan det vara bekvämt att leta efter värdepapper som har data för hela urvalsperioden. Om vi skulle testa strategin mot 15 års aktiedata, kan vi vara benägna att leta efter aktier som har fullständig information för hela 15-årsperioden.
Att eliminera en aktie som slutat handlas, eller som snart lämnade marknaden, skulle dock lägga in en bias i vårt dataprov. Eftersom vi bara inkluderar aktier som varade i 15-årsperioden, skulle våra slutliga resultat vara felaktiga, eftersom dessa presterade tillräckligt bra för att överleva marknaden.
Typer av provvalsbias
Förutom survivorship bias finns det flera andra typer av urvalsbias.
Reklam eller pre-screening bias
Detta inträffar när det sätt på vilket deltagarna är förhandsgranskade i en studie introducerar bias. Till exempel kan språkforskarna använda för att annonsera efter deltagare själva införa partiskhet i studien genom att helt enkelt avskräcka eller uppmuntra grupper av människor från att frivilligt delta.
###Självvalsbias
Självvalsbias – även känd som volontärsvarsbias – uppstår när studieorganisatörerna tillåter deltagare att själv välja eller frivilligt delta. Studieorganisatörerna avstår från kontrollen över vem som deltar till de som bestämmer sig för att ställa upp som volontär. Detta kan leda till att personer med specifika egenskaper eller åsikter frivilligt ställer upp på en studie och därmed förvränger resultaten.
Uteslutning och Undercover Bias
Uteslutningsbias uppstår när specifika medlemmar av en befolkning utesluts från att delta i en studie. Undertäckningsbias uppstår när studieorganisatörer skapar en studie som inte tillräckligt representerar vissa medlemmar av befolkningen.
Exempel på Sample Selection Bias
Hedgefonders prestationsindex är ett exempel på urvalsbias som är föremål för överlevnadsbias. Eftersom hedgefonder som inte överlever slutar rapportera sin prestation till indexaggregatorer, lutar de resulterande indexen naturligtvis till fonder och strategier som finns kvar, och därför "överlever". Detta kan också vara ett problem med populära fondrapporteringstjänster. Analytiker kan anpassa sig för att ta hänsyn till dessa fördomar men kan introducera nya fördomar i processen.
Observerbias uppstår när forskare projicerar sina egna övertygelser eller förväntningar till deltagarna i en studie och därmed förvränger studiens resultat. Detta inträffar ibland i samband med körsbärsplockning,. vilket är när forskare främst fokuserar på statistik som stöder deras hypotes.
Särskilda överväganden
Forskare och studieorganisatörer har ansvaret att se till att resultaten av deras studier är korrekta, relevanta och inte innehåller någon typ av partiskhet som kan leda till felaktiga slutsatser. Ett sätt att göra detta är att strukturera studien utifrån en metod som stödjer en slumpmässig urvalsprocess.
Även om detta i teorin kan tyckas tillräckligt enkelt, är verkligheten att forskaren måste vara vaksam i sina ansträngningar för att förhindra provtagningsbias. Dessutom kan studieorganisatören ställas inför restriktioner utanför deras kontroll som gör det utmanande att realisera ett slumpmässigt urval. Det kan till exempel vara brist på deltagare eller otillräcklig finansiering för projektet.
För att säkerställa att urvalet som studeras är slumpmässigt, bör forskaren identifiera de olika undergrupperna inom populationen. De bör sedan analysera provet för att avgöra om dessa undergrupper är tillräckligt representerade i studien.
I vissa fall kan forskaren upptäcka att vissa undergrupper antingen är överrepresenterade eller underrepresenterade i sin studie. Vid denna tidpunkt kan forskaren implementera bias-korrigeringsmetoder. En metod är att tilldela vikter till de felaktigt representerade undergrupperna för att statistiskt korrigera biasen. Detta vägda medelvärde tar hänsyn till den proportionella relevansen för varje undergrupp och kan leda till resultat som mer exakt återspeglar studiepopulationens faktiska demografi.
##Höjdpunkter
På grund av ett fel i urvalsprocessen utesluts en delmängd av data från studien, vilket påverkar eller förnekar testets statistiska signifikans.
Överlevnadsbias kan leda till falska slutsatser eftersom det bara fokuserar på de element, personer eller saker som har tagit det förbi en viss punkt i urvalsprocessen, och ignorerar de som inte gjorde det.
Det finns flera typer av urvalsbias, inklusive pre-screeningbias, självurvalsbias, exkluderingsbias och observatörsbias.
Ett sätt att korrigera urvalsbias är att tilldela vikter till felaktiga undergrupper för att statistiskt korrigera biasen.
– Provurvalsbias i en forskningsstudie uppstår när icke-slumpmässiga data väljs ut för statistisk analys.