Investor's wiki

Stratifierad stickprovtagning

Stratifierad stickprovtagning

Vad är stratifierat slumpmässigt urval?

Stratifierat slumpmässigt urval är en metod för urval som innebär att en population delas upp i mindre undergrupper som kallas strata. I stratifierat slumpmässigt urval, eller stratifiering, bildas strata baserat på medlemmarnas gemensamma attribut eller egenskaper såsom inkomst eller utbildningsnivå.

Stratifierat slumpmässigt urval kallas även proportionellt slumpmässigt urval eller kvotslumpmässigt urval.

Hur stratifierad slumpmässig sampling fungerar

När en forskare slutför analys eller forskning om en grupp enheter med liknande egenskaper kan en forskare upptäcka att populationsstorleken är för stor för att kunna genomföra forskningen. För att spara tid och pengar kan en analytiker ta ett mer genomförbart tillvägagångssätt genom att välja en liten grupp från befolkningen. Den lilla gruppen kallas en urvalsstorlek,. vilket är en delmängd av populationen som används för att representera hela populationen. Ett urval kan väljas från en population på ett antal sätt, varav ett är den stratifierade slumpmässiga urvalsmetoden.

Ett stratifierat slumpmässigt urval innebär att man delar in hela populationen i homogena grupper som kallas strata (plural för stratum). Slumpmässiga urval väljs sedan ut från varje stratum. Tänk till exempel på en akademisk forskare som skulle vilja veta antalet MBA-studenter 2007 som fick ett jobberbjudande inom tre månader efter examen.

Forskaren kommer snart att finna att det fanns nästan 200 000 MBA-utexaminerade för året. De kanske väljer att bara ta ett enkelt slumpmässigt urval av 50 000 akademiker och göra en undersökning. Ännu bättre, de kunde dela in populationen i strata och ta ett slumpmässigt urval från strata. För att göra detta skulle de skapa befolkningsgrupper baserade på kön, åldersintervall, ras, nationalitetsland och karriärbakgrund. Ett slumpmässigt urval från varje stratum tas i ett antal proportionellt mot stratumets storlek jämfört med populationen. Dessa delmängder av strata slås sedan samman för att bilda ett slumpmässigt urval.

Stratifierat urval används för att belysa skillnader mellan grupper i en population, till skillnad från ett enkelt slumpmässigt urval, som behandlar alla medlemmar i en population som lika, med lika stor sannolikhet att bli provtagna

Exempel på stratifierat slumpmässigt urval

Anta att ett forskarlag vill bestämma GPA för universitetsstudenter över hela USA. Forskargruppen har svårt att samla in data från alla 21 miljoner universitetsstudenter; den beslutar sig för att ta ett slumpmässigt urval av befolkningen genom att använda 4 000 studenter.

Antag nu att teamet tittar på de olika attributen hos provdeltagarna och undrar om det finns några skillnader i GPA och studenters huvudämne. Anta att den finner att 560 studenter är engelska majors, 1 135 är naturvetenskap, 800 är datavetenskap majors, 1 090 är ingenjörer och 415 är matte. Teamet vill använda ett proportionellt stratifierat slumpmässigt urval där urvalets stratum är proportionellt mot det slumpmässiga urvalet i populationen.

Anta att teamet undersöker demografin för universitetsstudenter i USA och hittar procentandelen av vad studenterna har huvudämne i: 12 % huvudämne i engelska, 28 % huvudämne i naturvetenskap, 24 % huvudämne i datavetenskap, 21 % huvudämne i teknik och 15 % huvudämne i matematik. Således skapas fem strata från den stratifierade slumpmässiga urvalsprocessen.

Teamet måste sedan bekräfta att populationens stratum står i proportion till stratumet i urvalet; men de finner att proportionerna inte är lika. Teamet måste sedan ta ett nytt urval av 4 000 elever från befolkningen och slumpmässigt välja ut 480 engelska, 1 120 vetenskaps-, 960 datavetenskaps-, 840 ingenjörs- och 600 matematikelever.

Med dessa har den ett proportionellt stratifierat slumpmässigt urval av studenter, vilket ger en bättre representation av studenters högskolestudier i USA. Forskarna kan sedan lyfta fram specifika stratum, observera de olika studierna av amerikanska högskolestudenter och observera de olika betygsgenomsnitten .

Enkla slumpmässiga kontra stratifierade slumpmässiga prov

Enkla slumpmässiga urval och stratifierade slumpmässiga urval är båda statistiska mätverktyg. Ett enkelt slumpmässigt urval används för att representera hela datapopulationen. Ett stratifierat slumpmässigt urval delar in populationen i mindre grupper, eller strata, baserat på gemensamma egenskaper.

Det enkla slumpmässiga urvalet används ofta när det finns mycket lite information tillgänglig om datapopulationen, när datapopulationen har alldeles för många skillnader för att dela upp i olika delmängder, eller när det bara finns en distinkt egenskap bland datapopulationen.

Till exempel kan ett godisföretag vilja studera sina kunders köpvanor för att avgöra framtiden för sin produktlinje. Om det finns 10 000 kunder kan den använda 100 av dessa kunder som ett slumpmässigt urval. Den kan sedan tillämpa vad den hittar från dessa 100 kunder till resten av sin bas. Till skillnad från stratifiering kommer den att ta ett urval av 100 medlemmar rent slumpmässigt utan hänsyn till deras individuella egenskaper.

Proportionell och oproportionerlig stratifiering

Stratifierat slumpmässigt urval säkerställer att varje undergrupp av en given population är tillräckligt representerad inom hela urvalspopulationen i en forskningsstudie. Stratifiering kan vara proportionerlig eller oproportionerlig. I en proportionell stratifierad metod är urvalsstorleken för varje stratum proportionell mot stratumets populationsstorlek.

Till exempel, om forskaren ville ha ett urval av 50 000 akademiker med hjälp av åldersintervall, kommer det proportionella stratifierade slumpmässiga urvalet att erhållas med hjälp av denna formel: (provstorlek/populationsstorlek) x stratumstorlek. Tabellen nedan antar en befolkningsstorlek på 180 000 MBA-utexaminerade per år.

TTT

Strataprovstorleken för MBA-utexaminerade i åldersintervallet 24 till 28 år beräknas som (50 000/180 000) x 90 000 = 25 000. Samma metod används för de andra åldersgrupperna. Nu när strataprovstorleken är känd kan forskaren utföra enkla slumpmässiga urval i varje stratum för att välja sina undersökningsdeltagare. Med andra ord kommer 25 000 akademiker från åldersgruppen 24-28 att väljas slumpmässigt från hela befolkningen, 16 667 akademiker från 29-33 års åldern kommer att väljas ut ur befolkningen slumpmässigt, och så vidare.

I ett oproportionerligt stratifierat urval är storleken på varje stratum inte proportionell mot dess storlek i populationen. Forskaren kan besluta att ta prov på 1/2 av de utexaminerade inom åldersgruppen 34-37 år och 1/3 av de utexaminerade inom åldersgruppen 29-33 år.

Det är viktigt att notera att en person inte kan passa in i flera skikt. Varje enhet får bara passa i ett stratum. Att ha överlappande undergrupper innebär att vissa individer kommer att ha högre chanser att bli valda för undersökningen, vilket helt förnekar konceptet med stratifierat urval som en typ av sannolikhetsurval.

Portföljförvaltare kan använda stratifierat slumpmässigt urval för att skapa portföljer genom att replikera ett index som ett obligationsindex.

Fördelar med stratifierad slumpmässig sampling

Den största fördelen med stratifierat slumpmässigt urval är att det fångar nyckelpopulationsegenskaper i urvalet. I likhet med ett vägt medelvärde ger denna provtagningsmetod egenskaper i urvalet som är proportionella mot den totala populationen. Stratifierad slumpmässig sampling fungerar bra för populationer med en mängd olika attribut men är annars ineffektiv om undergrupper inte kan bildas.

Stratifiering ger ett mindre fel i uppskattningen och större precision än den enkla slumpmässiga urvalsmetoden. Ju större skillnaderna är mellan skikten, desto större blir precisionsförstärkningen.

Nackdelar med stratifierad slumpmässig sampling

Tyvärr kan denna forskningsmetod inte användas i varje studie. Metodens nackdel är att flera villkor måste vara uppfyllda för att den ska användas på rätt sätt. Forskare måste identifiera varje medlem av en population som studeras och klassificera var och en av dem i en, och endast en, subpopulation. Som ett resultat är stratifierad slumpmässig provtagning ofördelaktig när forskare inte med säkerhet kan klassificera varje medlem av befolkningen i en undergrupp. Det kan också vara svårt att hitta en uttömmande och definitiv lista över en hel befolkning .

Överlappning kan vara ett problem om det finns ämnen som faller in i flera undergrupper. När enkla slumpmässiga urval utförs är det mer sannolikt att de som är i flera undergrupper blir valda. Resultatet kan bli en felaktig framställning eller en felaktig återspegling av befolkningen.

Exemplen ovan gör det enkelt: grundutbildning, kandidatexamen, män och kvinnor är tydligt definierade grupper. I andra situationer kan det dock vara mycket svårare. Föreställ dig att införliva egenskaper som ras, etnicitet eller religion. Sorteringsprocessen blir svårare, vilket gör stratifierad stickprovstagning till en ineffektiv och mindre idealisk metod.

Höjdpunkter

– Stratifierat slumpmässigt urval skiljer sig från enkelt slumpmässigt urval, som innebär ett slumpmässigt urval av data från en hel population, så varje möjligt urval är lika sannolikt att inträffa.

– Stratifierat slumpmässigt urval går ut på att dela in hela populationen i homogena grupper som kallas strata.

– Stratifierat slumpmässigt urval gör att forskare kan få en provpopulation som bäst representerar hela populationen som studeras.