Campionamento casuale stratificato
Che cos'è il campionamento casuale stratificato?
Il campionamento casuale stratificato è un metodo di campionamento che prevede la divisione di una popolazione in sottogruppi più piccoli noti come strati. Nel campionamento casuale stratificato, o stratificazione, gli strati sono formati sulla base di attributi o caratteristiche condivisi dai membri come il reddito o il livello di istruzione.
Il campionamento casuale stratificato è anche chiamato campionamento casuale proporzionale o campionamento casuale a quote.
Come funziona il campionamento casuale stratificato
Quando si completa un'analisi o una ricerca su un gruppo di entità con caratteristiche simili, un ricercatore può scoprire che la dimensione della popolazione è troppo grande per poter completare la ricerca. Per risparmiare tempo e denaro, un analista può adottare un approccio più fattibile selezionando un piccolo gruppo dalla popolazione. Il piccolo gruppo è indicato come dimensione del campione,. che è un sottoinsieme della popolazione utilizzato per rappresentare l'intera popolazione. Un campione può essere selezionato da una popolazione in diversi modi, uno dei quali è il metodo di campionamento casuale stratificato.
Un campionamento casuale stratificato comporta la divisione dell'intera popolazione in gruppi omogenei chiamati strati (plurale per stratum). I campioni casuali vengono quindi selezionati da ciascuno strato. Ad esempio, si consideri un ricercatore accademico che vorrebbe conoscere il numero di studenti MBA nel 2007 che hanno ricevuto un'offerta di lavoro entro tre mesi dalla laurea.
Il ricercatore scoprirà presto che c'erano quasi 200.000 laureati MBA per l'anno. Potrebbero decidere di prendere un semplice campione casuale di 50.000 laureati e condurre un sondaggio. Meglio ancora, potrebbero dividere la popolazione in strati e prelevare un campione casuale dagli strati. Per fare ciò, creerebbero gruppi di popolazione basati su sesso, fascia di età, razza, paese di nazionalità e background professionale. Viene prelevato un campione casuale da ogni strato in numero proporzionale alla dimensione dello strato rispetto alla popolazione. Questi sottoinsiemi degli strati vengono quindi raggruppati per formare un campione casuale.
Il campionamento stratificato viene utilizzato per evidenziare le differenze tra i gruppi in una popolazione, al contrario del semplice campionamento casuale, che tratta tutti i membri di una popolazione come uguali, con uguale probabilità di essere campionati
Esempio di campionamento casuale stratificato
Supponiamo che un gruppo di ricerca voglia determinare il GPA degli studenti universitari negli Stati Uniti. Il gruppo di ricerca ha difficoltà a raccogliere dati da tutti i 21 milioni di studenti universitari; decide di prelevare un campione casuale della popolazione utilizzando 4.000 studenti.
Ora supponiamo che il team esamini i diversi attributi dei partecipanti del campione e si chieda se ci sono differenze nei GPA e nelle major degli studenti. Supponiamo che trovi 560 studenti laureati in inglese, 1.135 in scienze, 800 in informatica, 1.090 in ingegneria e 415 in matematica. Il team vuole utilizzare un campione casuale stratificato proporzionale in cui lo strato del campione è proporzionale al campione casuale nella popolazione.
Supponiamo che il team effettui ricerche sui dati demografici degli studenti universitari negli Stati Uniti e trovi la percentuale di ciò in cui gli studenti si specializzano: 12% in inglese, 28% in scienze, 24% in informatica, 21% in ingegneria e 15% maggiore in matematica. Pertanto, dal processo di campionamento casuale stratificato vengono creati cinque strati.
Il team deve quindi confermare che lo strato della popolazione è proporzionale allo strato nel campione; tuttavia, trovano che le proporzioni non sono uguali. Il team deve quindi ricampionare 4.000 studenti dalla popolazione e selezionare casualmente 480 studenti di inglese, 1.120 scienze, 960 informatica, 840 ingegneria e 600 studenti di matematica.
Con quelli, ha un campione casuale stratificato proporzionato di studenti universitari, che fornisce una migliore rappresentazione delle major degli studenti negli Stati Uniti I ricercatori possono quindi evidenziare strati specifici, osservare i vari studi degli studenti universitari statunitensi e osservare le varie medie dei voti .
Campioni casuali semplici e stratificati
Campioni casuali semplici e campioni casuali stratificati sono entrambi strumenti di misurazione statistica. Un semplice campione casuale viene utilizzato per rappresentare l'intera popolazione di dati. Un campione casuale stratificato divide la popolazione in gruppi più piccoli, o strati, in base a caratteristiche condivise.
Il semplice campione casuale viene spesso utilizzato quando sono disponibili pochissime informazioni sulla popolazione di dati, quando la popolazione di dati ha troppe differenze per essere suddivise in vari sottoinsiemi o quando c'è solo una caratteristica distinta nella popolazione di dati.
Ad esempio, un'azienda di caramelle potrebbe voler studiare le abitudini di acquisto dei suoi clienti per determinare il futuro della sua linea di prodotti. Se ci sono 10.000 clienti, può utilizzare scegli 100 di quei clienti come campione casuale. Può quindi applicare ciò che trova da quei 100 clienti al resto della sua base. A differenza della stratificazione, campionerà 100 membri in modo puramente casuale senza alcun riguardo per le loro caratteristiche individuali.
Stratificazione proporzionata e sproporzionata
Il campionamento casuale stratificato garantisce che ogni sottogruppo di una data popolazione sia adeguatamente rappresentato all'interno dell'intera popolazione campionaria di uno studio di ricerca. La stratificazione può essere proporzionata o sproporzionata. In un metodo stratificato proporzionato, la dimensione del campione di ogni strato è proporzionale alla dimensione della popolazione dello strato.
Ad esempio, se il ricercatore volesse un campione di 50.000 laureati per fascia di età, il campione casuale stratificato proporzionato sarà ottenuto utilizzando questa formula: (dimensione del campione/dimensione della popolazione) x dimensione dello strato. La tabella seguente presuppone una dimensione della popolazione di 180.000 laureati MBA all'anno.
TTT
La dimensione del campione degli strati per i laureati MBA nella fascia di età compresa tra 24 e 28 anni è calcolata come (50.000/180.000) x 90.000 = 25.000. Lo stesso metodo è utilizzato per le altre fasce di età. Ora che la dimensione del campione degli strati è nota, il ricercatore può eseguire un semplice campionamento casuale in ogni strato per selezionare i partecipanti al sondaggio. In altre parole, 25.000 laureati della fascia di età 24-28 anni verranno selezionati casualmente dall'intera popolazione, 16.667 laureati della fascia di età 29-33 anni verranno selezionati casualmente dalla popolazione e così via.
In un campione stratificato sproporzionato, la dimensione di ogni strato non è proporzionale alla sua dimensione nella popolazione. Il ricercatore può decidere di campionare 1/2 dei laureati della fascia 34-37 anni e 1/3 dei laureati della fascia 29-33 anni.
È importante notare che una persona non può rientrare in più strati. Ogni entità deve rientrare solo in uno strato. Avere sottogruppi sovrapposti significa che alcuni individui avranno maggiori possibilità di essere selezionati per l'indagine, il che nega completamente il concetto di campionamento stratificato come tipo di campionamento probabilistico.
I gestori di portafoglio possono utilizzare il campionamento casuale stratificato per creare portafogli replicando un indice come un indice obbligazionario.
Vantaggi del campionamento casuale stratificato
Il principale vantaggio del campionamento casuale stratificato è che cattura le caratteristiche chiave della popolazione nel campione. Simile a una media ponderata, questo metodo di campionamento produce nel campione caratteristiche proporzionali alla popolazione complessiva. Il campionamento casuale stratificato funziona bene per popolazioni con una varietà di attributi, ma è altrimenti inefficace se non è possibile formare sottogruppi.
La stratificazione fornisce un errore minore nella stima e una maggiore precisione rispetto al semplice metodo di campionamento casuale. Maggiore è la differenza tra gli strati, maggiore è il guadagno in precisione.
Svantaggi del campionamento casuale stratificato
Sfortunatamente, questo metodo di ricerca non può essere utilizzato in tutti gli studi. Lo svantaggio del metodo è che devono essere soddisfatte diverse condizioni affinché possa essere utilizzato correttamente. I ricercatori devono identificare ogni membro di una popolazione oggetto di studio e classificare ciascuno di essi in una, e solo una, sottopopolazione. Di conseguenza, il campionamento casuale stratificato è svantaggioso quando i ricercatori non possono classificare con sicurezza ogni membro della popolazione in un sottogruppo. Inoltre, trovare un elenco completo e definitivo di un'intera popolazione può essere difficile.
La sovrapposizione può essere un problema se ci sono soggetti che rientrano in più sottogruppi. Quando viene eseguito un campionamento casuale semplice, è più probabile che vengano scelti coloro che si trovano in più sottogruppi. Il risultato potrebbe essere una rappresentazione errata o un riflesso impreciso della popolazione.
Gli esempi sopra lo rendono facile: studenti universitari, laureati, maschi e femmine sono gruppi chiaramente definiti. In altre situazioni, tuttavia, potrebbe essere molto più difficile. Immagina di incorporare caratteristiche come razza, etnia o religione. Il processo di smistamento diventa più difficile, rendendo il campionamento casuale stratificato un metodo inefficace e tutt'altro che ideale.
Mette in risalto
Il campionamento casuale stratificato differisce dal campionamento casuale semplice, che implica la selezione casuale di dati da un'intera popolazione, quindi ogni possibile campione ha la stessa probabilità di verificarsi.
Il campionamento casuale stratificato prevede la divisione dell'intera popolazione in gruppi omogenei detti strati.
Il campionamento casuale stratificato consente ai ricercatori di ottenere una popolazione campione che rappresenta al meglio l'intera popolazione oggetto di studio.