Investor's wiki

Amostragem Aleatória Estratificada

Amostragem Aleatória Estratificada

O que é amostragem aleatória estratificada?

A amostragem aleatória estratificada é um método de amostragem que envolve a divisão de uma população em subgrupos menores conhecidos como estratos. Na amostragem aleatória estratificada, ou estratificação, os estratos são formados com base nos atributos ou características compartilhadas dos membros, como renda ou nível educacional.

A amostragem aleatória estratificada também é chamada de amostragem aleatória proporcional ou amostragem aleatória por cotas.

Como funciona a amostragem aleatória estratificada

Ao concluir uma análise ou pesquisa em um grupo de entidades com características semelhantes, um pesquisador pode descobrir que o tamanho da população é muito grande para concluir a pesquisa. Para economizar tempo e dinheiro, um analista pode adotar uma abordagem mais viável selecionando um pequeno grupo da população. O pequeno grupo é chamado de tamanho de amostra,. que é um subconjunto da população que é usado para representar toda a população. Uma amostra pode ser selecionada de uma população de várias maneiras, uma das quais é o método de amostragem aleatória estratificada.

Uma amostragem aleatória estratificada envolve a divisão de toda a população em grupos homogêneos chamados estratos (plural para estrato). Amostras aleatórias são então selecionadas de cada estrato. Por exemplo, considere um pesquisador acadêmico que gostaria de saber o número de alunos de MBA em 2007 que receberam uma oferta de emprego dentro de três meses após a formatura.

O pesquisador logo descobrirá que havia quase 200.000 graduados em MBA para o ano. Eles podem decidir apenas pegar uma amostra aleatória simples de 50.000 graduados e fazer uma pesquisa. Melhor ainda, eles poderiam dividir a população em estratos e tirar uma amostra aleatória dos estratos. Para fazer isso, eles criariam grupos populacionais baseados em gênero, faixa etária, raça, país de nacionalidade e histórico de carreira. Uma amostra aleatória de cada estrato é retirada em número proporcional ao tamanho do estrato quando comparado à população. Esses subconjuntos dos estratos são então agrupados para formar uma amostra aleatória.

A amostragem estratificada é usada para destacar diferenças entre grupos em uma população, ao contrário da amostragem aleatória simples, que trata todos os membros de uma população como iguais, com igual probabilidade de serem amostrados

Exemplo de amostragem aleatória estratificada

Suponha que uma equipe de pesquisa queira determinar o GPA de estudantes universitários nos EUA. A equipe de pesquisa tem dificuldade em coletar dados de todos os 21 milhões de estudantes universitários; ele decide fazer uma amostra aleatória da população usando 4.000 alunos.

Agora suponha que a equipe observe os diferentes atributos dos participantes da amostra e se pergunte se existem diferenças nos GPAs e nos cursos dos alunos. Suponha que ele descubra que 560 alunos são de inglês, 1.135 de ciências, 800 de ciência da computação, 1.090 de engenharia e 415 de matemática. A equipe quer usar uma amostra aleatória estratificada proporcional onde o estrato da amostra é proporcional à amostra aleatória na população.

Suponha que a equipe pesquise a demografia de estudantes universitários nos EUA e encontre a porcentagem em que os alunos se especializam: 12% em inglês, 28% em ciências, 24% em ciência da computação, 21% em engenharia e 15% principal em matemática. Assim, são criados cinco estratos a partir do processo de amostragem aleatória estratificada.

A equipe precisa então confirmar que o estrato da população é proporcional ao estrato da amostra; no entanto, eles descobrem que as proporções não são iguais. A equipe então precisa reavaliar 4.000 alunos da população e selecionar aleatoriamente 480 alunos de inglês, 1.120 de ciências, 960 de ciência da computação, 840 de engenharia e 600 de matemática.

Com eles, tem uma amostra aleatória estratificada proporcional de estudantes universitários, o que fornece uma melhor representação dos cursos universitários dos estudantes nos EUA. .

Amostras Aleatórias Simples versus Amostras Aleatórias Estratificadas

Amostras aleatórias simples e amostras aleatórias estratificadas são ferramentas de medição estatística. Uma amostra aleatória simples é usada para representar toda a população de dados. Uma amostra aleatória estratificada divide a população em grupos menores, ou estratos, com base em características compartilhadas.

A amostra aleatória simples é frequentemente usada quando há muito pouca informação disponível sobre a população de dados, quando a população de dados tem muitas diferenças para dividir em vários subconjuntos ou quando há apenas uma característica distinta entre a população de dados.

Por exemplo, uma empresa de doces pode querer estudar os hábitos de compra de seus clientes para determinar o futuro de sua linha de produtos. Se houver 10.000 clientes, pode-se escolher 100 desses clientes como amostra aleatória. Ele pode então aplicar o que encontrar desses 100 clientes ao restante de sua base. Ao contrário da estratificação, ela irá amostrar 100 membros de forma puramente aleatória, sem qualquer consideração por suas características individuais.

Estratificação Proporcional e Desproporcional

A amostragem aleatória estratificada garante que cada subgrupo de uma determinada população seja adequadamente representado dentro de toda a amostra populacional de um estudo de pesquisa. A estratificação pode ser proporcional ou desproporcional. Em um método estratificado proporcional, o tamanho da amostra de cada estrato é proporcional ao tamanho da população do estrato.

Por exemplo, se o pesquisador desejasse uma amostra de 50.000 egressos por faixa etária, a amostra aleatória estratificada proporcional será obtida por meio desta fórmula: (tamanho da amostra/tamanho da população) x tamanho do estrato. A tabela abaixo assume um tamanho populacional de 180.000 graduados em MBA por ano.

TTT

O tamanho da amostra de estratos para graduados de MBA na faixa etária de 24 a 28 anos é calculado como (50.000/180.000) x 90.000 = 25.000. O mesmo método é utilizado para as demais faixas etárias. Agora que o tamanho da amostra dos estratos é conhecido, o pesquisador pode realizar uma amostragem aleatória simples em cada estrato para selecionar os participantes de sua pesquisa. Em outras palavras, 25.000 graduados da faixa etária de 24 a 28 anos serão selecionados aleatoriamente de toda a população, 16.667 graduados da faixa etária de 29 a 33 anos serão selecionados aleatoriamente da população e assim por diante.

Em uma amostra estratificada desproporcional, o tamanho de cada estrato não é proporcional ao seu tamanho na população. O pesquisador pode decidir amostrar 1/2 dos egressos na faixa etária de 34 a 37 anos e 1/3 dos egressos na faixa etária de 29 a 33 anos.

É importante notar que uma pessoa não pode se encaixar em vários estratos. Cada entidade deve caber apenas em um estrato. A sobreposição de subgrupos significa que alguns indivíduos terão maiores chances de serem selecionados para a pesquisa, o que nega completamente o conceito de amostragem estratificada como um tipo de amostragem probabilística.

Os gerentes de portfólio podem usar amostragem aleatória estratificada para criar portfólios replicando um índice como um índice de títulos.

Vantagens da Amostragem Aleatória Estratificada

A principal vantagem da amostragem aleatória estratificada é que ela captura as características da população-chave na amostra. Semelhante a uma média ponderada, esse método de amostragem produz características na amostra que são proporcionais à população geral. A amostragem aleatória estratificada funciona bem para populações com uma variedade de atributos, mas é ineficaz se subgrupos não puderem ser formados.

A estratificação fornece um erro menor na estimativa e maior precisão do que o método de amostragem aleatória simples. Quanto maiores as diferenças entre os estratos, maior o ganho de precisão.

Desvantagens da Amostragem Aleatória Estratificada

Infelizmente, este método de pesquisa não pode ser usado em todos os estudos. A desvantagem do método é que várias condições devem ser atendidas para que ele seja usado corretamente. Os pesquisadores devem identificar cada membro de uma população que está sendo estudada e classificar cada um deles em uma, e apenas uma, subpopulação. Como resultado, a amostragem aleatória estratificada é desvantajosa quando os pesquisadores não podem classificar com confiança todos os membros da população em um subgrupo. Além disso, encontrar uma lista exaustiva e definitiva de uma população inteira pode ser um desafio.

A sobreposição pode ser um problema se houver assuntos que se enquadram em vários subgrupos. Quando a amostragem aleatória simples é realizada, aqueles que estão em vários subgrupos são mais propensos a serem escolhidos. O resultado pode ser uma deturpação ou um reflexo impreciso da população.

Os exemplos acima facilitam: graduação, pós-graduação, masculino e feminino são grupos claramente definidos. Em outras situações, no entanto, pode ser muito mais difícil. Imagine incorporar características como raça, etnia ou religião. O processo de classificação torna-se mais difícil, tornando a amostragem aleatória estratificada um método ineficaz e menos do que ideal.

##Destaques

  • A amostragem aleatória estratificada difere da amostragem aleatória simples, que envolve a seleção aleatória de dados de uma população inteira, de modo que cada amostra possível tem a mesma probabilidade de ocorrer.

  • A amostragem aleatória estratificada envolve a divisão de toda a população em grupos homogêneos chamados estratos.

  • A amostragem aleatória estratificada permite aos pesquisadores obter uma amostra populacional que melhor representa toda a população estudada.