Prøvevalgsbias
Hvad er prøveudvælgelsesbias?
Prøveudvælgelsesbias er en type bias forårsaget af valg af ikke-tilfældige data til statistisk analyse. Bias eksisterer på grund af en fejl i prøveudvælgelsesprocessen, hvor en delmængde af dataene systematisk udelukkes på grund af en bestemt attribut. Udelukkelsen af delmængden kan påvirke testens statistiske signifikans, og den kan påvirke estimaterne af parametrene i den statistiske model.
Forstå prøvevalgsbias
Survivorship bias er en almindelig type prøveudvælgelsesbias. Denne type bias ignorerer de emner, der ikke nåede et bestemt punkt i udvælgelsesprocessen, og fokuserer kun på de emner, der "overlevede". Dette kan føre til falske konklusioner.
For eksempel, når du backtester en investeringsstrategi på en stor gruppe aktier, kan det være praktisk at kigge efter værdipapirer, der har data for hele prøveperioden. Hvis vi skulle teste strategien mod 15 års aktiedata, kunne vi være tilbøjelige til at lede efter aktier, der har fuldstændig information for hele 15-årsperioden.
At eliminere en aktie, der stoppede med at handle, eller kort forlod markedet, ville imidlertid indsætte en bias i vores dataeksempel. Da vi kun inkluderer aktier, der varede i 15-årsperioden, ville vores endelige resultater være mangelfulde, da disse klarede sig godt nok til at overleve markedet.
Typer af prøveudvælgelsesbias
Ud over survivorship bias er der flere andre typer prøveudvælgelsesbias.
Annoncering eller Pre-Screening Bias
Dette opstår, når den måde, deltagerne er forhåndsscreenet på i en undersøgelse, introducerer bias. For eksempel kan det sprog, forskere bruger til at annoncere efter deltagere, selv indføre bias i undersøgelsen blot ved at fraråde eller opmuntre bestemte grupper af mennesker fra at melde sig frivilligt til at deltage.
###Selvvalgsbias
Selvvalgsbias – også kendt som frivillig respons bias – opstår, når studiearrangørerne giver deltagerne mulighed for selv at vælge eller melder sig frivilligt til at deltage. Studiearrangørerne afgiver kontrollen over, hvem der deltager, til dem, der beslutter sig for at melde sig frivilligt. Dette kan få personer med specifikke karakteristika eller meninger til at melde sig frivilligt til en undersøgelse og dermed skævvride resultaterne.
Eksklusion og Undercover Bias
Eksklusionsbias opstår, når specifikke medlemmer af en befolkning udelukkes fra at deltage i en undersøgelse. Undercoverage bias opstår, når studiearrangører opretter en undersøgelse, der ikke i tilstrækkelig grad repræsenterer nogle medlemmer af befolkningen.
Eksempel på Sample Selection Bias
Hedgefonds præstationsindekser er et eksempel på prøveudvælgelsesbias med forbehold for overlevelsesbias. Fordi hedgefonde, der ikke overlever, holder op med at rapportere deres resultater til indeksaggregatorer, vippes de resulterende indekser naturligt til fonde og strategier, der forbliver, og derfor "overlever". Dette kan også være et problem med populære rapporteringstjenester for investeringsforeninger. Analytikere kan justere for at tage hensyn til disse skævheder, men kan introducere nye skævheder i processen.
Observatørbias opstår, når forskere projicerer deres egne overbevisninger eller forventninger til deltagere i en undersøgelse, og derved skævvrider undersøgelsens resultater. Dette sker nogle gange i forbindelse med cherry-picking,. hvilket er, når forskere primært fokuserer på statistik, der understøtter deres hypotese.
Særlige overvejelser
Forskere og studiearrangører har ansvaret for at sikre, at resultaterne af deres undersøgelser er nøjagtige, relevante og ikke inkorporerer nogen form for bias, der kan føre til fejlagtige konklusioner. En måde at gøre dette på er at strukturere undersøgelsen baseret på en metode, der understøtter en tilfældig stikprøveudvælgelsesproces.
Selvom dette i teorien kan virke simpelt nok, er virkeligheden, at forskeren bliver nødt til at være på vagt i deres bestræbelser på at forhindre prøveudvælgelsesbias. Derudover kan studiearrangøren blive konfronteret med begrænsninger uden for deres kontrol, der gør det udfordrende at realisere en tilfældig stikprøve. Det kan fx være mangel på deltagere eller mangelfuld finansiering til projektet.
For at sikre, at prøven, der undersøges, er tilfældig, bør forskeren identificere de forskellige undergrupper i populationen. De bør derefter analysere prøven for at afgøre, om disse undergrupper er tilstrækkeligt repræsenteret i undersøgelsen.
I nogle tilfælde kan forskeren opleve, at visse undergrupper enten er overrepræsenteret eller underrepræsenteret i deres undersøgelse. På dette tidspunkt kan forskeren implementere bias-korrektionsmetoder. En metode er at tildele vægte til de forkerte undergrupper for at statistisk korrigere skævheden. Dette vægtede gennemsnit tager højde for den forholdsmæssige relevans af hver undergruppe og kan føre til resultater, der mere præcist afspejler undersøgelsespopulationens faktiske demografi.
##Højdepunkter
På grund af en fejl i prøveudvælgelsesprocessen udelukkes en delmængde af data fra undersøgelsen, hvilket påvirker eller negerer testens statistiske signifikans.
Survivorship bias kan føre til falske konklusioner, fordi det kun fokuserer på de elementer, mennesker eller ting, der har gjort det forbi et vist punkt i udvælgelsesprocessen, og ignorerer dem, der ikke gjorde det.
Der er flere typer stikprøveudvælgelsesbias, herunder præscreeningsbias, selvudvælgelsesbias, eksklusionsbias og observatørbias.
En måde at korrigere prøveudvælgelsesbias på er at tildele vægte til misrepræsenterede undergrupper for statistisk at korrigere skævheden.
Prøveudvælgelsesbias i et forskningsstudie opstår, når ikke-tilfældige data udvælges til statistisk analyse.