Distribuição T
O que é uma distribuição T?
A distribuição T, também conhecida como distribuição t de Student, é um tipo de distribuição de probabilidade semelhante à distribuição normal com sua forma de sino, mas com caudas pesadas. As distribuições T têm maior chance de valores extremos do que as distribuições normais, daí as caudas mais gordas.
O que uma distribuição T diz a você?
O peso da cauda é determinado por um parâmetro da distribuição T chamado graus de liberdade,. com valores menores dando caudas mais pesadas e com valores maiores fazendo com que a distribuição T se assemelhe a uma distribuição normal padrão com média 0 e desvio padrão de 1. A distribuição T também é conhecida como "Distribuição T de Student".
Quando uma amostra de n observações é retirada de uma população normalmente distribuída com média M e desvio padrão D, a média amostral, m, e o desvio padrão amostral, d, serão diferentes de M e D devido à aleatoriedade da amostra.
Um z-score pode ser calculado com o desvio padrão da população como Z = (x – M)/D, e esse valor tem a distribuição normal com média 0 e desvio padrão 1. Mas ao usar o desvio padrão estimado, um t-score é calculado como T = (m – M)/{d/sqrt(n)}, a diferença entre d e D torna a distribuição uma distribuição T com (n - 1) graus de liberdade em vez da distribuição normal com média 0 e desvio padrão 1.
Exemplo de como usar uma distribuição T
Veja o exemplo a seguir de como as distribuições t são usadas na análise estatística. Primeiro, lembre-se de que um intervalo de confiança para a média é um intervalo de valores, calculado a partir dos dados, destinado a capturar uma média de “população”. Este intervalo é m +- t*d/sqrt(n), onde t é um valor crítico da distribuição T.
Por exemplo, um intervalo de confiança de 95% para o retorno médio do Dow Jones Industrial Average nos 27 dias de negociação anteriores a 11/09/2001 é -0,33%, (+/- 2,055) * 1,07 / sqrt(27), dando um retorno médio (persistente) como algum número entre -0,75% e +0,09%. O número 2,055, a quantidade de erros padrão a serem ajustados, é encontrado na distribuição T.
Como a distribuição T possui caudas mais grossas que uma distribuição normal, ela pode ser usada como modelo para retornos financeiros que apresentam curtose excessiva, o que permitirá um cálculo mais realista do Valor em Risco ( VaR ) nesses casos.
A diferença entre uma distribuição T e uma distribuição normal
As distribuições normais são usadas quando a distribuição da população é assumida como normal. A distribuição T é semelhante à distribuição normal, apenas com caudas mais grossas. Ambos assumem uma população normalmente distribuída. As distribuições T têm curtose mais alta do que as distribuições normais. A probabilidade de obter valores muito distantes da média é maior com uma distribuição T do que com uma distribuição normal.
Limitações do uso de uma distribuição T
A distribuição T pode distorcer a exatidão em relação à distribuição normal. Sua deficiência só surge quando há necessidade de perfeita normalidade. A distribuição T só deve ser usada quando o desvio padrão da população não for conhecido. Se o desvio padrão da população for conhecido e o tamanho da amostra for grande o suficiente, a distribuição normal deve ser usada para obter melhores resultados.
##Destaques
A distribuição T é uma distribuição de probabilidade contínua do escore z quando o desvio padrão estimado é usado no denominador em vez do desvio padrão verdadeiro.
A distribuição T, como a distribuição normal, é em forma de sino e simétrica, mas possui caudas pesadas, o que significa que tende a produzir valores que caem longe de sua média.
Os testes T são usados em estatística para estimar a significância.