Investor's wiki

Estatísticas não paramétricas

Estatísticas não paramétricas

O que são estatísticas não paramétricas?

Estatística não paramétrica refere-se a um método estatístico no qual os dados não são assumidos como provenientes de modelos prescritos que são determinados por um pequeno número de parâmetros; exemplos de tais modelos incluem o modelo de distribuição normal e o modelo de regressão linear. As estatísticas não paramétricas às vezes usam dados ordinais, o que significa que não dependem de números, mas sim de uma classificação ou ordem de classificação. Por exemplo, uma pesquisa que transmita as preferências do consumidor variando de gostar a não gostar seria considerada um dado ordinal.

Estatísticas não paramétricas incluem estatísticas descritivas não paramétricas,. modelos estatísticos, inferência e testes estatísticos. A estrutura do modelo de modelos não paramétricos não é especificada a priori, mas é determinada a partir de dados. O termo não paramétrico não significa que tais modelos carecem completamente de parâmetros, mas sim que o número e a natureza dos parâmetros são flexíveis e não fixados antecipadamente. Um histograma é um exemplo de estimativa não paramétrica de uma distribuição de probabilidade.

Entendendo as Estatísticas Não Paramétricas

Em estatística, a estatística paramétrica inclui parâmetros como média, desvio padrão, correlação de Pearson, variância, etc. Esta forma de estatística usa os dados observados para estimar os parâmetros da distribuição. Sob estatísticas paramétricas, os dados são frequentemente assumidos como provenientes de uma distribuição normal com parâmetros desconhecidos μ (média populacional) e σ2 (variância populacional), que são então estimados usando a média amostral e a variância amostral.

As estatísticas não paramétricas não fazem suposições sobre o tamanho da amostra ou se os dados observados são quantitativos.

A estatística não paramétrica não pressupõe que os dados sejam extraídos de uma distribuição normal. Em vez disso, a forma da distribuição é estimada sob essa forma de medição estatística. Embora existam muitas situações em que uma distribuição normal pode ser assumida, também existem alguns cenários em que o verdadeiro processo de geração de dados está longe de ser distribuído normalmente.

Exemplos de estatísticas não paramétricas

No primeiro exemplo, considere um analista financeiro que deseja estimar o valor em risco (VaR) de um investimento. O analista reúne dados de ganhos de centenas de investimentos semelhantes em um horizonte de tempo semelhante. Em vez de assumir que os ganhos seguem uma distribuição normal, eles usam o histograma para estimar a distribuição de forma não paramétrica. O percentil 5 deste histograma fornece então ao analista uma estimativa não paramétrica do VaR.

Para um segundo exemplo, considere um pesquisador diferente que deseja saber se a média de horas de sono está ligada à frequência com que alguém adoece. Como muitas pessoas adoecem raramente, se é que adoecem, e ocasionalmente outras adoecem com muito mais frequência do que a maioria das outras, a distribuição da frequência da doença é claramente não normal, sendo assimétrica à direita e propensa a valores discrepantes. Assim, ao invés de usar um método que assume uma distribuição normal para a frequência de doença, como é feito na análise de regressão clássica, por exemplo, o pesquisador decide usar um método não paramétrico como a análise de regressão quantílica.

Considerações Especiais

As estatísticas não paramétricas ganharam reconhecimento devido à sua facilidade de uso. À medida que a necessidade de parâmetros é aliviada, os dados se tornam mais aplicáveis a uma variedade maior de testes. Esse tipo de estatística pode ser usado sem a média, tamanho da amostra, desvio padrão ou a estimativa de quaisquer outros parâmetros relacionados quando nenhuma dessas informações estiver disponível.

Como as estatísticas não paramétricas fazem menos suposições sobre os dados de amostra, sua aplicação é mais ampla em escopo do que as estatísticas paramétricas. Nos casos em que os testes paramétricos são mais apropriados, os métodos não paramétricos serão menos eficientes. Isso ocorre porque as estatísticas não paramétricas descartam algumas informações que estão disponíveis nos dados, diferentemente das estatísticas paramétricas.

##Destaques

  • Esse tipo de análise geralmente é mais adequado ao considerar a ordem de algo, onde, mesmo que os dados numéricos mudem, os resultados provavelmente permanecerão os mesmos.

  • As estatísticas não paramétricas são fáceis de usar, mas não oferecem a precisão exata de outros modelos estatísticos.