Investor's wiki

Intervalo de confiança

Intervalo de confiança

O que é intervalo de confiança?

Um intervalo de confiança, em estatística, refere-se à probabilidade de um parâmetro populacional cair entre um conjunto de valores por uma certa proporção de vezes.

Entendendo os intervalos de confiança

Os intervalos de confiança medem o grau de incerteza ou certeza em um método de amostragem. Eles podem assumir qualquer número de limites de probabilidade, sendo o mais comum um nível de confiança de 95% ou 99%. Os intervalos de confiança são conduzidos usando métodos estatísticos, como um teste t.

As estatísticas usam intervalos de confiança para medir a incerteza em uma variável amostral. Por exemplo, um pesquisador seleciona diferentes amostras aleatoriamente da mesma população e calcula um intervalo de confiança para cada amostra para ver como ela pode representar o verdadeiro valor da variável populacional. Os conjuntos de dados resultantes são todos diferentes; alguns intervalos incluem o verdadeiro parâmetro populacional e outros não.

Um intervalo de confiança é um intervalo de valores, limitado acima e abaixo da média da estatística,. que provavelmente conteria um parâmetro populacional desconhecido. O nível de confiança refere-se à porcentagem de probabilidade, ou certeza, de que o intervalo de confiança conteria o parâmetro populacional verdadeiro quando você extrai uma amostra aleatória muitas vezes. Ou, no vernáculo, "temos 99% de certeza (nível de confiança) de que a maioria dessas amostras (intervalos de confiança) contém o verdadeiro parâmetro populacional".

O maior equívoco em relação aos intervalos de confiança é que eles representam a porcentagem de dados de uma determinada amostra que fica entre os limites superior e inferior. Por exemplo, pode-se interpretar erroneamente o intervalo de confiança de 99% acima mencionado de 70 a 78 polegadas como indicando que 99% dos dados em uma amostra aleatória estão entre esses números. Isso é incorreto, embora exista um método separado de análise estatística para fazer tal determinação. Fazer isso envolve identificar a média e o desvio padrão da amostra e traçar esses números em uma curva de sino.

O intervalo de confiança e o nível de confiança estão inter-relacionados, mas não são exatamente os mesmos.

Calculando o intervalo de confiança

Suponha que um grupo de pesquisadores esteja estudando as alturas de jogadores de basquete do ensino médio. Os pesquisadores pegam uma amostra aleatória da população e estabelecem uma altura média de 74 polegadas.

A média de 74 polegadas é uma estimativa pontual da média populacional. Uma estimativa pontual por si só tem utilidade limitada porque não revela a incerteza associada à estimativa; você não tem uma boa noção de quão distante essa média amostral de 74 polegadas pode estar da média populacional. O que está faltando é o grau de incerteza nesta única amostra.

Os intervalos de confiança fornecem mais informações do que as estimativas pontuais. Ao estabelecer um intervalo de confiança de 95% usando a média e o desvio padrão da amostra,. e assumindo uma distribuição normal representada pela curva de sino, os pesquisadores chegam a um limite superior e inferior que contém a média verdadeira em 95% das vezes.

Suponha que o intervalo esteja entre 72 polegadas e 76 polegadas. Se os pesquisadores coletarem 100 amostras aleatórias da população de jogadores de basquete do ensino médio como um todo, a média deve cair entre 72 e 76 polegadas em 95 dessas amostras.

Se os pesquisadores quiserem uma confiança ainda maior, eles podem expandir o intervalo para 99% de confiança. Fazer isso invariavelmente cria uma faixa mais ampla, pois abre espaço para um número maior de médias amostrais. Se eles estabelecerem o intervalo de confiança de 99% entre 70 polegadas e 78 polegadas, eles podem esperar que 99 de 100 amostras avaliadas contenham um valor médio entre esses números.

Um nível de confiança de 90%, por outro lado, implica que esperaríamos que 90% das estimativas de intervalo incluíssem o parâmetro populacional e assim por diante.

Destaques

  • Eles são mais frequentemente construídos usando níveis de confiança de 95% ou 99%.

  • Um intervalo de confiança exibe a probabilidade de um parâmetro cair entre um par de valores em torno da média.

  • Os intervalos de confiança medem o grau de incerteza ou certeza em um método de amostragem.

PERGUNTAS FREQUENTES

O que é um equívoco comum sobre intervalos de confiança?

O maior equívoco em relação aos intervalos de confiança é que eles representam a porcentagem de dados de uma determinada amostra que fica entre os limites superior e inferior. Em outras palavras, seria incorreto supor que um intervalo de confiança de 99% significa que 99% dos dados em uma amostra aleatória estão entre esses limites. O que isso realmente significa é que se pode ter 99% de certeza de que o intervalo conterá a média populacional.

O que é um teste T?

Os intervalos de confiança são conduzidos usando métodos estatísticos, como um teste t. Um teste t é um tipo de estatística inferencial usada para determinar se há uma diferença significativa entre as médias de dois grupos, que pode estar relacionada a determinadas características. O cálculo de um teste t requer três valores de dados principais. Eles incluem a diferença entre os valores médios de cada conjunto de dados (chamado de diferença média), o desvio padrão de cada grupo e o número de valores de dados de cada grupo.

O que um intervalo de confiança revela?

Um intervalo de confiança é um intervalo de valores, limitado acima e abaixo da média da estatística, que provavelmente conteria um parâmetro populacional desconhecido. O nível de confiança refere-se à porcentagem de probabilidade, ou certeza, de que o intervalo de confiança conteria o parâmetro populacional verdadeiro quando você extrai uma amostra aleatória muitas vezes.

Como os intervalos de confiança são usados?

Os estatísticos usam intervalos de confiança para medir a incerteza em uma variável amostral. Por exemplo, um pesquisador seleciona diferentes amostras aleatoriamente da mesma população e calcula um intervalo de confiança para cada amostra para ver como ela pode representar o verdadeiro valor da variável populacional. Os conjuntos de dados resultantes são todos diferentes, onde alguns intervalos incluem o verdadeiro parâmetro populacional e outros não.