Investor's wiki

Eksempelutvalgsskjevhet

Eksempelutvalgsskjevhet

Hva er prøveutvalgsskjevhet?

Utvalgsskjevhet er en type skjevhet forårsaket av å velge ikke-tilfeldige data for statistisk analyse. Skjevheten eksisterer på grunn av en feil i prøveutvelgelsesprosessen, der en delmengde av dataene systematisk ekskluderes på grunn av en bestemt egenskap. Ekskludering av delmengden kan påvirke den statistiske signifikansen til testen, og den kan fordreie estimatene av parametere til den statistiske modellen.

Forstå Sample Selection Bias

Survivorship bias er en vanlig type utvalgsskjevhet. Denne typen skjevhet ignorerer de fagene som ikke kom forbi et visst punkt i utvelgelsesprosessen og fokuserer kun på fagene som "overlevde." Dette kan føre til falske konklusjoner.

For eksempel, når du tester en investeringsstrategi på en stor gruppe aksjer, kan det være praktisk å se etter verdipapirer som har data for hele prøveperioden. Hvis vi skulle teste strategien mot 15 års aksjedata, kan vi være tilbøyelige til å se etter aksjer som har fullstendig informasjon for hele 15-årsperioden.

Å eliminere en aksje som sluttet å handle, eller som snart forlot markedet, ville imidlertid legge inn en skjevhet i datautvalget vårt. Siden vi bare inkluderer aksjer som varte i 15-årsperioden, ville de endelige resultatene våre være feilaktige, siden disse presterte godt nok til å overleve markedet.

Typer prøveutvalgsskjevhet

I tillegg til survivorship bias, er det flere andre typer prøveutvelgelsesskjevhet.

Annonsering eller pre-screening skjevhet

Dette skjer når måten deltakerne forhåndsscreenes på i en studie introduserer skjevhet. For eksempel kan språkforskerne bruker for å annonsere for deltakere selv introdusere skjevheter i studien ganske enkelt ved å fraråde eller oppmuntre visse grupper mennesker fra å melde seg frivillig til å delta.

Selvvalgskjevhet

Selvvalgskjevhet – også kjent som frivillig respons-bias – oppstår når studiearrangørene lar deltakerne selv velge eller melder seg frivillig til å delta. Studiearrangørene gir fra seg kontrollen over hvem som deltar til de som bestemmer seg for å melde seg frivillig. Dette kan føre til at personer med spesifikke egenskaper eller meninger melder seg frivillig til en studie og dermed forvrenge resultatene.

Ekskludering og Underdekning Bias

Utelukkelsesskjevhet oppstår når spesifikke medlemmer av en populasjon blir ekskludert fra å delta i en studie. Underdekningsskjevhet oppstår når studiearrangører lager en studie som ikke i tilstrekkelig grad representerer noen medlemmer av befolkningen.

Eksempel på Sample Selection Bias

Hedgefondsytelsesindekser er ett eksempel på skjevhet for utvalgsutvalg som er underlagt skjevhet for overlevende. Fordi hedgefond som ikke overlever slutter å rapportere resultatene sine til indeksaggregatorer, vippes resulterende indekser naturlig til fond og strategier som gjenstår, og dermed "overlever". Dette kan også være et problem med populære verdipapirfondsrapporteringstjenester. Analytikere kan justere for å ta hensyn til disse skjevhetene, men kan introdusere nye skjevheter i prosessen.

Observatørskjevhet oppstår når forskere projiserer sine egne overbevisninger eller forventninger til deltakerne i en studie, og dermed forvrider resultatene av studien. Dette skjer noen ganger i forbindelse med kirsebærplukking,. som er når forskere primært fokuserer på statistikk som støtter deres hypotese.

Spesielle hensyn

Forskere og studiearrangører har ansvaret for å sikre at resultatene av studiene deres er nøyaktige, relevante og ikke inneholder noen form for skjevhet som kan føre til feilaktige konklusjoner. En måte å gjøre dette på er å strukturere studien basert på en metode som støtter en tilfeldig utvalgsprosess.

Selv om dette i teorien kan virke enkelt nok, er realiteten at forskeren må være årvåken i sin innsats for å forhindre skjevhet i prøveutvelgelsen. I tillegg kan studiearrangøren bli møtt med begrensninger utenfor deres kontroll som gjør det utfordrende å realisere et tilfeldig utvalg. Det kan for eksempel være mangel på deltakere eller mangelfull finansiering av prosjektet.

For å sikre at utvalget som studeres er tilfeldig, bør forskeren identifisere de ulike undergruppene i populasjonen. De bør deretter analysere prøven for å finne ut om disse undergruppene er tilstrekkelig representert i studien.

I noen tilfeller kan forskeren finne at visse undergrupper enten er overrepresentert eller underrepresentert i studien. På dette tidspunktet kan forskeren implementere skjevhetskorreksjonsmetoder. En metode er å tildele vekter til de feilrepresenterte undergruppene for å statistisk korrigere skjevheten. Dette vektede gjennomsnittet tar hensyn til den proporsjonale relevansen til hver undergruppe og kan føre til resultater som mer nøyaktig gjenspeiler studiepopulasjonens faktiske demografi.

Høydepunkter

  • På grunn av en feil i prøveutvelgelsesprosessen, blir en delmengde av dataene ekskludert fra studien, noe som påvirker eller negerer den statistiske signifikansen til testen.

  • Overlevelsesskjevhet kan føre til falske konklusjoner fordi den fokuserer kun på de elementene, menneskene eller tingene som har gjort det forbi et visst punkt i utvelgelsesprosessen, og ignorerer de som ikke gjorde det.

  • Det finnes flere typer skjevhet for utvalgsutvelgelse, inkludert skjevhet for forhåndsscreening, selvutvelgelse, eksklusjonsskjevhet og observatørskjevhet.

  • En måte å korrigere skjevhet for utvalgsutvalg er å tilordne vekter til feilrepresenterte undergrupper for å statistisk korrigere skjevheten.

  • Prøvevalgskjevhet i en forskningsstudie oppstår når ikke-tilfeldige data velges for statistisk analyse.