Stratifisert tilfeldig prøvetaking
Hva er stratifisert tilfeldig prøvetaking?
Stratifisert tilfeldig prøvetaking er en metode for prøvetaking som involverer inndeling av en populasjon i mindre undergrupper kjent som strata. Ved stratifisert tilfeldig prøvetaking, eller stratifisering, dannes lagene basert på medlemmenes delte egenskaper eller egenskaper som inntekt eller utdanning.
Stratifisert stikkprøvetaking kalles også proporsjonal stikkprøve eller kvotestikkprøve.
Hvordan Stratified Random Sampling fungerer
Når man fullfører analyser eller forskning på en gruppe enheter med lignende egenskaper, kan en forsker finne at populasjonsstørrelsen er for stor til å fullføre forskning. For å spare tid og penger kan en analytiker ta på seg en mer gjennomførbar tilnærming ved å velge en liten gruppe fra befolkningen. Den lille gruppen omtales som en utvalgsstørrelse,. som er en delmengde av populasjonen som brukes til å representere hele populasjonen. Et utvalg kan velges fra en populasjon på en rekke måter, hvorav en er den stratifiserte tilfeldige prøvetakingsmetoden.
En stratifisert tilfeldig prøvetaking innebærer å dele hele populasjonen inn i homogene grupper kalt strata (flertall for stratum). Tilfeldige utvalg velges deretter fra hvert stratum. Tenk for eksempel på en akademisk forsker som ønsker å vite antall MBA-studenter i 2007 som mottok et jobbtilbud innen tre måneder etter endt utdanning.
Forskeren vil snart finne ut at det var nesten 200 000 MBA-utdannede for året. De kan bestemme seg for å ta et enkelt tilfeldig utvalg på 50 000 nyutdannede og gjennomføre en undersøkelse. Enda bedre, de kunne dele populasjonen inn i strata og ta et tilfeldig utvalg fra strataene. For å gjøre dette ville de opprette befolkningsgrupper basert på kjønn, aldersgruppe, rase, nasjonalitetsland og karrierebakgrunn. Et tilfeldig utvalg fra hvert stratum tas i et tall proporsjonalt med stratumets størrelse sammenlignet med populasjonen. Disse undersettene av lagene blir deretter samlet for å danne en tilfeldig prøve.
Stratifisert utvalg brukes til å fremheve forskjeller mellom grupper i en populasjon, i motsetning til enkel tilfeldig prøvetaking, som behandler alle medlemmer av en populasjon som like, med like stor sannsynlighet for å bli utvalgt
Eksempel på stratifisert tilfeldig sampling
Anta at et forskerteam ønsker å bestemme GPA for studenter over hele USA. Forskerteamet har problemer med å samle inn data fra alle 21 millioner studenter; den bestemmer seg for å ta et tilfeldig utvalg av befolkningen ved å bruke 4000 studenter.
Anta nå at teamet ser på de forskjellige egenskapene til prøvedeltakerne og lurer på om det er noen forskjeller i GPA og studentenes hovedfag. Anta at den finner at 560 studenter er engelske hovedfag, 1135 er naturfag, 800 er datavitenskap, 1090 er ingeniørfag og 415 er matematikkfag. Teamet ønsker å bruke et proporsjonalt stratifisert tilfeldig utvalg der stratumet i utvalget er proporsjonalt med det tilfeldige utvalget i populasjonen.
Anta at teamet undersøker demografien til universitetsstudenter i USA og finner prosentandelen av det studentene har hovedfag i: 12 % hovedfag i engelsk, 28 % hovedfag i naturfag, 24 % hovedfag i informatikk, 21 % hovedfag i ingeniørfag og 15 % hovedfag i matematikk. Dermed opprettes fem strata fra den stratifiserte tilfeldige prøvetakingsprosessen.
Teamet må da bekrefte at stratumet av populasjonen er proporsjonalt med stratumet i utvalget; de finner imidlertid at proporsjonene ikke er like. Teamet må deretter prøve 4000 studenter fra befolkningen på nytt og tilfeldig velge 480 engelske, 1120 naturfag, 960 informatikk, 840 ingeniører og 600 matematikkstudenter.
Med disse har den et proporsjonalt stratifisert tilfeldig utvalg av studenter, som gir en bedre representasjon av studentenes høyskolefag i USA. Forskerne kan deretter fremheve spesifikke stratum, observere de varierende studiene til amerikanske studenter og observere de forskjellige karaktergjennomsnittene .
Enkle tilfeldige versus lagdelte tilfeldige prøver
Enkle stikkprøver og stratifiserte stikkprøver er begge statistiske måleverktøy. Et enkelt tilfeldig utvalg brukes til å representere hele datapopulasjonen. Et stratifisert tilfeldig utvalg deler befolkningen inn i mindre grupper, eller strata, basert på felles egenskaper.
Det enkle tilfeldige utvalget brukes ofte når det er svært lite tilgjengelig informasjon om datapopulasjonen, når datapopulasjonen har alt for mange forskjeller til å dele inn i ulike delmengder, eller når det bare er én distinkt egenskap blant datapopulasjonen.
For eksempel kan et godterifirma være lurt å studere kjøpsvanene til kundene sine for å bestemme fremtiden til produktlinjen. Hvis det er 10 000 kunder, kan den bruke velge 100 av disse kundene som et tilfeldig utvalg. Den kan deretter bruke det den finner fra de 100 kundene til resten av basen. I motsetning til stratifisering, vil den prøve 100 medlemmer rent tilfeldig uten hensyn til deres individuelle egenskaper.
Proporsjonal og uforholdsmessig stratifisering
Stratifisert tilfeldig prøvetaking sikrer at hver undergruppe av en gitt populasjon er tilstrekkelig representert innenfor hele utvalgspopulasjonen i en forskningsstudie. Stratifisering kan være proporsjonal eller uforholdsmessig. I en proporsjonal stratifisert metode er utvalgsstørrelsen til hvert stratum proporsjonal med populasjonsstørrelsen til stratumet.
For eksempel, hvis forskeren ønsket et utvalg på 50 000 kandidater ved bruk av aldersgruppe, vil det proporsjonale stratifiserte tilfeldige utvalget bli oppnådd ved å bruke denne formelen: (utvalgsstørrelse/populasjonsstørrelse) x stratumstørrelse. Tabellen nedenfor antar en befolkningsstørrelse på 180 000 MBA-kandidater per år.
TTT
Strataprøvestørrelsen for MBA-kandidater i aldersområdet 24 til 28 år beregnes som (50 000/180 000) x 90 000 = 25 000. Samme metode brukes for de andre aldersgruppene. Nå som stratautvalgets størrelse er kjent, kan forskeren utføre enkel tilfeldig prøvetaking i hvert stratum for å velge sine undersøkelsesdeltakere. Med andre ord vil 25 000 nyutdannede fra aldersgruppen 24-28 bli valgt tilfeldig fra hele befolkningen, 16 667 nyutdannede fra 29-33 år vil bli valgt ut tilfeldig fra befolkningen, og så videre.
I et uforholdsmessig stratifisert utvalg er størrelsen på hvert stratum ikke proporsjonal med størrelsen i populasjonen. Forskeren kan bestemme seg for å prøve 1/2 av kandidatene innenfor aldersgruppen 34-37 år og 1/3 av kandidatene innenfor aldersgruppen 29-33 år.
Det er viktig å merke seg at én person ikke kan passe inn i flere lag. Hver enhet må bare passe inn i ett stratum. Å ha overlappende undergrupper betyr at enkelte individer vil ha høyere sjanser for å bli valgt ut til undersøkelsen, noe som fullstendig negerer konseptet med stratifisert utvalg som en type sannsynlighetsutvalg.
Porteføljeforvaltere kan bruke stratifisert tilfeldig utvalg for å lage porteføljer ved å replikere en indeks som en obligasjonsindeks.
Fordeler med Stratified Random Sampling
Den største fordelen med stratifisert tilfeldig prøvetaking er at den fanger opp sentrale populasjonsegenskaper i utvalget. I likhet med et vektet gjennomsnitt gir denne prøvetakingsmetoden egenskaper i utvalget som er proporsjonale med den totale populasjonen. Stratifisert tilfeldig prøvetaking fungerer godt for populasjoner med en rekke attributter, men er ellers ineffektiv hvis undergrupper ikke kan dannes.
Stratifisering gir mindre feil i estimering og større presisjon enn den enkle stikkprøvemetoden. Jo større forskjellene mellom lagene er, desto større blir presisjonsgevinsten.
Ulemper ved stratifisert tilfeldig prøvetaking
Dessverre kan ikke denne forskningsmetoden brukes i alle studier. Metodens ulempe er at flere betingelser må være oppfylt for at den skal brukes riktig. Forskere må identifisere hvert medlem av en populasjon som studeres og klassifisere hver av dem i én, og bare én, underpopulasjon. Som et resultat er stratifisert tilfeldig prøvetaking ufordelaktig når forskere ikke trygt kan klassifisere hvert medlem av befolkningen i en undergruppe. Det kan også være utfordrende å finne en uttømmende og definitiv liste over en hel befolkning .
Overlapping kan være et problem hvis det er emner som faller inn i flere undergrupper. Når enkel tilfeldig prøvetaking utføres, er det mer sannsynlig at de som er i flere undergrupper blir valgt. Resultatet kan være en feilaktig fremstilling eller unøyaktig refleksjon av befolkningen.
Eksemplene ovenfor gjør det enkelt: undergraduate, graduate, mann og kvinne er klart definerte grupper. I andre situasjoner kan det imidlertid være langt vanskeligere. Tenk deg å inkludere egenskaper som rase, etnisitet eller religion. Sorteringsprosessen blir vanskeligere, noe som gjør stratifisert tilfeldig prøvetaking til en ineffektiv og mindre enn ideell metode.
Høydepunkter
– Stratifisert tilfeldig utvalg skiller seg fra enkel tilfeldig utvalg, som innebærer tilfeldig utvalg av data fra en hel populasjon, så det er like sannsynlig at hvert mulig utvalg forekommer.
– Stratifisert stikkprøver går ut på å dele hele populasjonen inn i homogene grupper kalt strata.
– Stratifisert tilfeldig prøvetaking lar forskere få en utvalgspopulasjon som best representerer hele populasjonen som studeres.