Investor's wiki

Distribuição de amostras

Distribuição de amostras

O que é uma distribuição de amostragem?

Uma distribuição amostral é uma distribuição de probabilidade de uma estatística obtida a partir de um número maior de amostras extraídas de uma população específica. A distribuição amostral de uma dada população é a distribuição de freqüências de uma série de diferentes desfechos que podem ocorrer para uma estatística de uma população.

Em estatística,. uma população é todo o conjunto do qual uma amostra estatística é extraída. Uma população pode se referir a um grupo inteiro de pessoas, objetos, eventos, visitas a hospitais ou medições. Assim, pode-se dizer que uma população é uma observação agregada de sujeitos agrupados por uma característica comum.

  • Uma distribuição amostral é uma estatística obtida por meio de amostragem repetida de uma população maior.
  • Descreve uma gama de resultados possíveis de uma estatística, como a média ou moda de alguma variável, pois realmente existe uma população.
  • A maioria dos dados analisados pelos pesquisadores são, na verdade, extraídos de amostras, e não de populações.

Entendendo a Distribuição de Amostragem

Muitos dados extraídos e usados por acadêmicos, estatísticos, pesquisadores, profissionais de marketing, analistas etc. são na verdade amostras, não populações. Uma amostra é um subconjunto de uma população. Por exemplo, um pesquisador médico que queria comparar o peso médio de todos os bebês nascidos na América do Norte de 1995 a 2005 com os nascidos na América do Sul no mesmo período de tempo não pode, dentro de um período de tempo razoável, extrair os dados para toda a população de mais de um milhão de partos ocorridos no período de dez anos. Em vez disso, eles usarão apenas o peso de, digamos, 100 bebês, em cada continente para chegar a uma conclusão. O peso de 200 bebês utilizado é a amostra e o peso médio calculado é a média amostral.

Agora suponha que, em vez de coletar apenas uma amostra de 100 pesos de recém-nascidos de cada continente, o pesquisador médico colete amostras aleatórias repetidas da população geral e calcule a média amostral para cada grupo amostral. Assim, para a América do Norte, eles extraem dados de 100 pesos de recém-nascidos registrados nos EUA, Canadá e México da seguinte forma: quatro 100 amostras de hospitais selecionados nos EUA, cinco 70 amostras do Canadá e três 150 registros do México, para um total de 1.200 pesos de recém-nascidos agrupados em 12 conjuntos. Eles também coletam dados amostrais de 100 pesos ao nascer de cada um dos 12 países da América do Sul.

Cada amostra tem sua própria média amostral e a distribuição das médias amostrais é conhecida como distribuição amostral.

O peso médio calculado para cada conjunto de amostras é a distribuição amostral da média. Não apenas a média pode ser calculada a partir de uma amostra. Outras estatísticas,. como desvio padrão, variância, proporção e intervalo, podem ser calculadas a partir de dados de amostra. O desvio padrão e a variância medem a variabilidade da distribuição amostral.

O número de observações em uma população, o número de observações em uma amostra e o procedimento usado para desenhar os conjuntos amostrais determinam a variabilidade de uma distribuição amostral. O desvio padrão de uma distribuição amostral é chamado de erro padrão. Enquanto a média de uma distribuição amostral é igual à média da população, o erro padrão depende do desvio padrão da população, do tamanho da população e do tamanho da amostra.

Saber quão distantes as médias de cada um dos conjuntos amostrais estão entre si e da média populacional dará uma indicação de quão próxima a média amostral está da média populacional. O erro padrão da distribuição amostral diminui à medida que o tamanho da amostra aumenta.

Considerações Especiais

Uma população ou um conjunto amostral de números terá uma distribuição normal. No entanto, como uma distribuição amostral inclui vários conjuntos de observações, ela não terá necessariamente uma forma de sino.

Seguindo nosso exemplo, o peso médio da população de bebês na América do Norte e na América do Sul tem uma distribuição normal porque alguns bebês estarão abaixo do peso (abaixo da média) ou acima do peso (acima da média), com a maioria dos bebês caindo no meio (em torno da média). ). Se o peso médio dos recém-nascidos na América do Norte for de três quilos, o peso médio da amostra em cada um dos 12 conjuntos de observações registradas para a América do Norte também estará próximo de três quilos.

No entanto, se você representar graficamente cada uma das médias calculadas em cada um dos 1.200 grupos de amostra, a forma resultante pode resultar em uma distribuição uniforme, mas é difícil prever com certeza qual será a forma real. Quanto mais amostras o pesquisador usar da população de mais de um milhão de figuras de peso, mais o gráfico começará a formar uma distribuição normal.