Stratificeret tilfældig stikprøve
Hvad er Stratified Random Sampling?
Stratificeret tilfældig prøveudtagning er en prøveudtagningsmetode, der involverer opdeling af en population i mindre undergrupper kendt som strata. Ved stratificeret tilfældig stikprøve eller stratificering dannes strata baseret på medlemmers fælles egenskaber eller karakteristika såsom indkomst eller uddannelsesniveau.
Stratificeret stikprøveudtagning kaldes også proportional stikprøveudtagning eller kvotetilfældig stikprøve.
Hvordan Stratified Random Sampling fungerer
Når en forsker gennemfører analyse eller forskning på en gruppe af enheder med lignende karakteristika, kan en forsker finde ud af, at populationsstørrelsen er for stor til at kunne gennemføre forskning. For at spare tid og penge kan en analytiker tage en mere gennemførlig tilgang ved at vælge en lille gruppe fra befolkningen. Den lille gruppe omtales som en stikprøvestørrelse,. som er en delmængde af populationen, der bruges til at repræsentere hele populationen. En stikprøve kan udvælges fra en population på en række måder, hvoraf den ene er den stratificerede tilfældige prøveudtagningsmetode.
En stratificeret tilfældig stikprøve indebærer opdeling af hele populationen i homogene grupper kaldet strata (flertal for stratum). Tilfældige prøver udvælges derefter fra hvert stratum. Overvej for eksempel en akademisk forsker, der gerne vil vide, hvor mange MBA-studerende i 2007, der modtog et jobtilbud inden for tre måneder efter eksamen.
Forskeren vil snart opdage, at der var næsten 200.000 MBA-kandidater for året. De beslutter måske bare at tage et simpelt tilfældigt udsnit af 50.000 kandidater og køre en undersøgelse. Endnu bedre kunne de opdele populationen i strata og tage en tilfældig prøve fra strataene. For at gøre dette ville de oprette befolkningsgrupper baseret på køn, aldersgruppe, race, nationalitetsland og karrierebaggrund. En tilfældig prøve fra hvert stratum udtages i et tal, der er proportionalt med stratumets størrelse sammenlignet med populationen. Disse delmængder af strataene samles derefter for at danne en tilfældig prøve.
Stratificeret stikprøve bruges til at fremhæve forskelle mellem grupper i en population, i modsætning til simpel tilfældig stikprøve, som behandler alle medlemmer af en population som lige, med lige stor sandsynlighed for at blive udtaget
Eksempel på Stratified Random Sampling
Antag, at et forskerhold ønsker at bestemme GPA for universitetsstuderende i hele USA. Forskerholdet har svært ved at indsamle data fra alle 21 millioner universitetsstuderende; den beslutter sig for at tage et tilfældigt udsnit af befolkningen ved at bruge 4.000 studerende.
Antag nu, at holdet ser på prøvedeltagernes forskellige egenskaber og spekulerer på, om der er forskelle i GPA'er og studerendes hovedfag. Antag, at det finder ud af, at 560 studerende er engelske hovedfag, 1.135 er naturvidenskabelige, 800 er datalogi hovedfag, 1.090 er ingeniørfag, og 415 er matematik hovedfag. Holdet ønsker at bruge en proportional stratificeret tilfældig stikprøve, hvor stratumet af stikprøven er proportional med den tilfældige prøve i populationen.
Antag, at holdet undersøger demografien for universitetsstuderende i USA og finder procentdelen af, hvad de studerende har hovedfag i: 12 % hovedfag i engelsk, 28 % hovedfag i naturvidenskab, 24 % hovedfag i datalogi, 21 % hovedfag i ingeniørvidenskab og 15 % hovedfag i matematik. Således skabes fem strata fra den stratificerede tilfældige prøveudtagningsproces.
Holdet skal derefter bekræfte, at stratumet af populationen er i forhold til stratumet i stikprøven; de finder dog, at proportionerne ikke er ens. Holdet skal derefter genudtage 4.000 elever fra befolkningen og tilfældigt udvælge 480 engelske, 1.120 naturvidenskabelige, 960 datalogi, 840 ingeniører og 600 matematikstuderende.
Med disse har den en proportional stratificeret tilfældig stikprøve af universitetsstuderende, som giver en bedre repræsentation af studerendes universitetsfag i USA. Forskerne kan derefter fremhæve specifikke stratum, observere de forskellige undersøgelser af amerikanske universitetsstuderende og observere de forskellige karaktergennemsnit .
Simple Random Versus Stratified Random Samples
Simple tilfældige prøver og stratificerede tilfældige prøver er begge statistiske måleværktøjer. En simpel tilfældig stikprøve bruges til at repræsentere hele datapopulationen. En stratificeret tilfældig stikprøve opdeler befolkningen i mindre grupper eller strata baseret på fælles karakteristika.
Den simple tilfældige stikprøve bruges ofte, når der er meget lidt tilgængelig information om datapopulationen, når datapopulationen har alt for mange forskelle til at kunne opdeles i forskellige delmængder, eller når der kun er én distinkt karakteristik blandt datapopulationen.
For eksempel kan en slikvirksomhed ønsker at studere sine kunders købsvaner for at bestemme fremtiden for sin produktlinje. Hvis der er 10.000 kunder, kan den bruge vælge 100 af disse kunder som en tilfældig stikprøve. Det kan derefter anvende, hvad det finder fra disse 100 kunder til resten af sin base. I modsætning til stratificering vil den stikprøve 100 medlemmer rent tilfældigt uden hensyntagen til deres individuelle karakteristika.
Proportionel og uforholdsmæssig stratificering
Stratificeret tilfældig stikprøve sikrer, at hver undergruppe af en given population er tilstrækkeligt repræsenteret i hele prøvepopulationen af en forskningsundersøgelse. Stratificering kan være proportional eller uforholdsmæssig. I en proportional stratificeret metode er stikprøvestørrelsen af hvert stratum proportional med populationsstørrelsen af stratumet.
For eksempel, hvis forskeren ønskede en stikprøve på 50.000 kandidater ved brug af aldersgruppe, vil den forholdsmæssige stratificerede tilfældige prøve blive opnået ved hjælp af denne formel: (stikprøvestørrelse/befolkningsstørrelse) x stratumstørrelse. Tabellen nedenfor antager en befolkningsstørrelse på 180.000 MBA-kandidater om året.
TTT
Strata-stikprøvestørrelsen for MBA-kandidater i aldersgruppen 24 til 28 år beregnes som (50.000/180.000) x 90.000 = 25.000. Samme metode bruges for de øvrige aldersgrupper. Nu hvor stratastikprøvestørrelsen er kendt, kan forskeren udføre simpel tilfældig stikprøve i hvert stratum for at udvælge sine undersøgelsesdeltagere. Med andre ord vil 25.000 kandidater fra aldersgruppen 24-28 blive udvalgt tilfældigt fra hele befolkningen, 16.667 kandidater fra 29-33 år vil blive udvalgt tilfældigt fra befolkningen, og så videre.
I en uforholdsmæssig stratificeret prøve er størrelsen af hvert stratum ikke proportional med dets størrelse i populationen. Forskeren kan beslutte at udtage 1/2 af kandidaterne inden for aldersgruppen 34-37 og 1/3 af kandidaterne inden for aldersgruppen 29-33 år.
Det er vigtigt at bemærke, at én person ikke kan passe ind i flere lag. Hver enhed må kun passe i ét stratum. At have overlappende undergrupper betyder, at nogle individer vil have større chancer for at blive udvalgt til undersøgelsen, hvilket fuldstændig negerer konceptet med stratificeret stikprøve som en form for sandsynlighedsudvalg.
Porteføljeforvaltere kan bruge stratificeret tilfældig stikprøve til at skabe porteføljer ved at replikere et indeks, såsom et obligationsindeks.
Fordele ved Stratified Random Sampling
Den største fordel ved stratificeret tilfældig stikprøve er, at den fanger nøglepopulationskarakteristika i stikprøven. I lighed med et vægtet gennemsnit frembringer denne prøveudtagningsmetode karakteristika i stikprøven, der er proportionale med den samlede population. Stratificeret tilfældig prøvetagning fungerer godt for populationer med en række attributter, men er ellers ineffektiv, hvis undergrupper ikke kan dannes.
Stratificering giver en mindre fejl i estimering og større præcision end den simple stikprøvemetode. Jo større forskelle der er mellem lagene, jo større er gevinsten i præcision.
Ulemper ved Stratified Random Sampling
Desværre kan denne forskningsmetode ikke bruges i enhver undersøgelse. Metodens ulempe er, at flere betingelser skal være opfyldt, for at den kan bruges rigtigt. Forskere skal identificere hvert medlem af en befolkning, der undersøges, og klassificere hver af dem i én og kun én subpopulation. Som et resultat er stratificeret tilfældig prøvetagning ufordelagtig, når forskere ikke med sikkerhed kan klassificere hvert medlem af befolkningen i en undergruppe. Det kan også være en udfordring at finde en udtømmende og endelig liste over en hel befolkning .
Overlapning kan være et problem, hvis der er emner, der falder ind i flere undergrupper. Når der udføres simpel tilfældig stikprøve, er de, der er i flere undergrupper, mere tilbøjelige til at blive valgt. Resultatet kan være en forkert fremstilling eller unøjagtig afspejling af befolkningen.
Ovenstående eksempler gør det nemt: bachelor, kandidat, mand og kvinde er klart definerede grupper. I andre situationer kan det dog være langt sværere. Forestil dig at inkorporere karakteristika som race, etnicitet eller religion. Sorteringsprocessen bliver vanskeligere, hvilket gør stratificeret tilfældig prøveudtagning til en ineffektiv og mindre end ideel metode.
Højdepunkter
Stratificeret tilfældig stikprøve adskiller sig fra simpel tilfældig stikprøve, som involverer tilfældig udvælgelse af data fra en hel population, så hver mulig stikprøve er lige sandsynlig.
Stratificeret tilfældig stikprøve går ud på at dele hele befolkningen i homogene grupper kaldet strata.
Stratificeret tilfældig stikprøve giver forskere mulighed for at opnå en prøvepopulation, der bedst repræsenterer hele den population, der undersøges.