Teorema do Limite Central (CLT)
O que é o Teorema Central do Limite (CLT)?
Na teoria da probabilidade, o teorema do limite central (CLT) afirma que a distribuição de uma variável amostral se aproxima de uma distribuição normal (ou seja, uma “curva de sino”) à medida que o tamanho da amostra se torna maior, assumindo que todas as amostras são idênticas em tamanho e, independentemente da forma de distribuição real da população.
Dito de outra forma, CLT é uma premissa estatística de que, dado um tamanho de amostra suficientemente grande de uma população com um nível finito de variância, a média de todas as variáveis amostradas da mesma população será aproximadamente igual à média de toda a população. Além disso, essas amostras se aproximam de uma distribuição normal,. com suas variâncias sendo aproximadamente iguais à variância e da população à medida que o tamanho da amostra aumenta, de acordo com a lei dos grandes números.
Embora este conceito tenha sido desenvolvido pela primeira vez por Abraham de Moivre em 1733, não foi formalizado até 1930, quando o notável matemático húngaro George Pólya o apelidou de teorema do limite central.
Entendendo o Teorema do Limite Central (CLT)
De acordo com o teorema do limite central, a média de uma amostra de dados estará mais próxima da média da população geral em questão, à medida que o tamanho da amostra aumentar, independentemente da distribuição real dos dados. Em outras palavras, os dados são precisos se a distribuição for normal ou aberrante.
Como regra geral, tamanhos de amostra de cerca de 30-50 são considerados suficientes para que o CLT seja mantido, o que significa que a distribuição das médias amostrais é razoavelmente distribuída normalmente. Portanto, quanto mais amostras são retiradas, mais os resultados gráficos assumem a forma de uma distribuição normal. Observe, no entanto, que o teorema do limite central ainda será aproximado em muitos casos para tamanhos de amostra muito menores, como n=8 ou n=5.
O teorema do limite central é frequentemente usado em conjunto com a lei dos grandes números, que afirma que a média das médias amostrais e os desvios padrão chegarão mais perto de igualar a média populacional e o desvio padrão à medida que o tamanho da amostra cresce, o que é extremamente útil em prever com precisão as características das populações.
Componentes-chave do Teorema do Limite Central
O teorema do limite central é composto por várias características-chave. Essas características giram em grande parte em torno de amostras, tamanhos de amostra e população de dados.
A amostragem é sucessiva. Isso significa que algumas unidades de amostra são comuns com unidades de amostra selecionadas em ocasiões anteriores.
A amostragem é aleatória. Todas as amostras devem ser selecionadas aleatoriamente para que tenham a mesma possibilidade estatística de serem selecionadas.
As amostras devem ser independentes. As seleções ou resultados de uma amostra não devem ter relação com amostras futuras ou outros resultados de amostra.
As amostras devem ser limitadas. É frequentemente citado que uma amostra não deve ser superior a 10% de uma população se a amostragem for feita sem reposição. Em geral, tamanhos populacionais maiores justificam o uso de tamanhos de amostra maiores.
O tamanho da amostra está aumentando. O teorema do limite central é relevante à medida que mais amostras são selecionadas.
O Teorema Central do Limite em Finanças
O CLT é útil ao examinar os retornos de uma ação individual ou de índices mais amplos, pois a análise é simples, devido à relativa facilidade de geração dos dados financeiros necessários. Consequentemente, investidores de todos os tipos contam com o CLT para analisar retornos de ações, construir portfólios e gerenciar riscos.
Digamos, por exemplo, que um investidor deseja analisar o retorno geral de um índice de ações que compreende 1.000 ações. Nesse cenário, esse investidor pode simplesmente estudar uma amostra aleatória de ações para cultivar os retornos estimados do índice total. Para ser seguro, pelo menos 30-50 ações selecionadas aleatoriamente em vários setores devem ser amostradas para o teorema do limite central. Além disso, as ações previamente selecionadas devem ser trocadas por nomes diferentes para ajudar a eliminar o viés.
Destaques
O teorema do limite central (CLT) afirma que a distribuição das médias amostrais se aproxima de uma distribuição normal à medida que o tamanho da amostra aumenta, independentemente da distribuição da população.
Tamanhos de amostra iguais ou superiores a 30 são frequentemente considerados suficientes para que o CLT seja mantido.
Um aspecto fundamental da CLT é que a média das médias amostrais e os desvios padrão serão iguais à média populacional e ao desvio padrão.
Um tamanho de amostra suficientemente grande pode prever as características de uma população com mais precisão.
CLT é útil em finanças ao analisar uma grande coleção de títulos para estimar distribuições de portfólio e características de retorno, risco e correlação.
PERGUNTAS FREQUENTES
Por que o Teorema do Limite Central é útil?
O teorema do limite central é útil ao analisar grandes conjuntos de dados porque permite supor que a distribuição amostral da média será normalmente distribuída na maioria dos casos. Isso permite uma análise estatística e inferência mais fáceis. Por exemplo, os investidores podem usar o teorema do limite central para agregar dados de desempenho de títulos individuais e gerar distribuição de médias amostrais que representam uma distribuição populacional maior para retornos de títulos ao longo de um período de tempo.
Qual é a fórmula do Teorema do Limite Central?
O teorema do limite central não tem fórmula própria, mas se baseia na média amostral e no desvio padrão. À medida que as médias amostrais são coletadas da população, o desvio padrão é usado para distribuir os dados em uma curva de distribuição de probabilidade.
Por que o tamanho da amostra minimizada do Teorema do Limite Central é 30?
Um tamanho de amostra de 30 é bastante comum nas estatísticas. Um tamanho de amostra de 30 geralmente aumenta o intervalo de confiança de seu conjunto de dados de população o suficiente para garantir afirmações contra suas descobertas. Quanto maior o tamanho da sua amostra, maior a probabilidade de a amostra ser representativa do seu conjunto populacional.