Intervalo de confiança
O que é intervalo de confiança?
Um intervalo de confiança, em estatÃstica, refere-se à probabilidade de um parâmetro populacional cair entre um conjunto de valores por uma certa proporção de vezes.
Entendendo os intervalos de confiança
Os intervalos de confiança medem o grau de incerteza ou certeza em um método de amostragem. Eles podem assumir qualquer número de limites de probabilidade, sendo o mais comum um nÃvel de confiança de 95% ou 99%. Os intervalos de confiança são conduzidos usando métodos estatÃsticos, como um teste t.
As estatÃsticas usam intervalos de confiança para medir a incerteza em uma variável amostral. Por exemplo, um pesquisador seleciona diferentes amostras aleatoriamente da mesma população e calcula um intervalo de confiança para cada amostra para ver como ela pode representar o verdadeiro valor da variável populacional. Os conjuntos de dados resultantes são todos diferentes; alguns intervalos incluem o verdadeiro parâmetro populacional e outros não.
Um intervalo de confiança é um intervalo de valores, limitado acima e abaixo da média da estatÃstica,. que provavelmente conteria um parâmetro populacional desconhecido. O nÃvel de confiança refere-se à porcentagem de probabilidade, ou certeza, de que o intervalo de confiança conteria o parâmetro populacional verdadeiro quando você extrai uma amostra aleatória muitas vezes. Ou, no vernáculo, "temos 99% de certeza (nÃvel de confiança) de que a maioria dessas amostras (intervalos de confiança) contém o verdadeiro parâmetro populacional".
O maior equÃvoco em relação aos intervalos de confiança é que eles representam a porcentagem de dados de uma determinada amostra que fica entre os limites superior e inferior. Por exemplo, pode-se interpretar erroneamente o intervalo de confiança de 99% acima mencionado de 70 a 78 polegadas como indicando que 99% dos dados em uma amostra aleatória estão entre esses números. Isso é incorreto, embora exista um método separado de análise estatÃstica para fazer tal determinação. Fazer isso envolve identificar a média e o desvio padrão da amostra e traçar esses números em uma curva de sino.
O intervalo de confiança e o nÃvel de confiança estão inter-relacionados, mas não são exatamente os mesmos.
Calculando o intervalo de confiança
Suponha que um grupo de pesquisadores esteja estudando as alturas de jogadores de basquete do ensino médio. Os pesquisadores pegam uma amostra aleatória da população e estabelecem uma altura média de 74 polegadas.
A média de 74 polegadas é uma estimativa pontual da média populacional. Uma estimativa pontual por si só tem utilidade limitada porque não revela a incerteza associada à estimativa; você não tem uma boa noção de quão distante essa média amostral de 74 polegadas pode estar da média populacional. O que está faltando é o grau de incerteza nesta única amostra.
Os intervalos de confiança fornecem mais informações do que as estimativas pontuais. Ao estabelecer um intervalo de confiança de 95% usando a média e o desvio padrão da amostra,. e assumindo uma distribuição normal representada pela curva de sino, os pesquisadores chegam a um limite superior e inferior que contém a média verdadeira em 95% das vezes.
Suponha que o intervalo esteja entre 72 polegadas e 76 polegadas. Se os pesquisadores coletarem 100 amostras aleatórias da população de jogadores de basquete do ensino médio como um todo, a média deve cair entre 72 e 76 polegadas em 95 dessas amostras.
Se os pesquisadores quiserem uma confiança ainda maior, eles podem expandir o intervalo para 99% de confiança. Fazer isso invariavelmente cria uma faixa mais ampla, pois abre espaço para um número maior de médias amostrais. Se eles estabelecerem o intervalo de confiança de 99% entre 70 polegadas e 78 polegadas, eles podem esperar que 99 de 100 amostras avaliadas contenham um valor médio entre esses números.
Um nÃvel de confiança de 90%, por outro lado, implica que esperarÃamos que 90% das estimativas de intervalo incluÃssem o parâmetro populacional e assim por diante.
Destaques
Eles são mais frequentemente construÃdos usando nÃveis de confiança de 95% ou 99%.
Um intervalo de confiança exibe a probabilidade de um parâmetro cair entre um par de valores em torno da média.
Os intervalos de confiança medem o grau de incerteza ou certeza em um método de amostragem.
PERGUNTAS FREQUENTES
O que é um equÃvoco comum sobre intervalos de confiança?
O maior equÃvoco em relação aos intervalos de confiança é que eles representam a porcentagem de dados de uma determinada amostra que fica entre os limites superior e inferior. Em outras palavras, seria incorreto supor que um intervalo de confiança de 99% significa que 99% dos dados em uma amostra aleatória estão entre esses limites. O que isso realmente significa é que se pode ter 99% de certeza de que o intervalo conterá a média populacional.
O que é um teste T?
Os intervalos de confiança são conduzidos usando métodos estatÃsticos, como um teste t. Um teste t é um tipo de estatÃstica inferencial usada para determinar se há uma diferença significativa entre as médias de dois grupos, que pode estar relacionada a determinadas caracterÃsticas. O cálculo de um teste t requer três valores de dados principais. Eles incluem a diferença entre os valores médios de cada conjunto de dados (chamado de diferença média), o desvio padrão de cada grupo e o número de valores de dados de cada grupo.
O que um intervalo de confiança revela?
Um intervalo de confiança é um intervalo de valores, limitado acima e abaixo da média da estatÃstica, que provavelmente conteria um parâmetro populacional desconhecido. O nÃvel de confiança refere-se à porcentagem de probabilidade, ou certeza, de que o intervalo de confiança conteria o parâmetro populacional verdadeiro quando você extrai uma amostra aleatória muitas vezes.
Como os intervalos de confiança são usados?
Os estatÃsticos usam intervalos de confiança para medir a incerteza em uma variável amostral. Por exemplo, um pesquisador seleciona diferentes amostras aleatoriamente da mesma população e calcula um intervalo de confiança para cada amostra para ver como ela pode representar o verdadeiro valor da variável populacional. Os conjuntos de dados resultantes são todos diferentes, onde alguns intervalos incluem o verdadeiro parâmetro populacional e outros não.