Estatísticas não paramétricas
O que são estatÃsticas não paramétricas?
EstatÃstica não paramétrica refere-se a um método estatÃstico no qual os dados não são assumidos como provenientes de modelos prescritos que são determinados por um pequeno número de parâmetros; exemplos de tais modelos incluem o modelo de distribuição normal e o modelo de regressão linear. As estatÃsticas não paramétricas à s vezes usam dados ordinais, o que significa que não dependem de números, mas sim de uma classificação ou ordem de classificação. Por exemplo, uma pesquisa que transmita as preferências do consumidor variando de gostar a não gostar seria considerada um dado ordinal.
EstatÃsticas não paramétricas incluem estatÃsticas descritivas não paramétricas,. modelos estatÃsticos, inferência e testes estatÃsticos. A estrutura do modelo de modelos não paramétricos não é especificada a priori, mas é determinada a partir de dados. O termo não paramétrico não significa que tais modelos carecem completamente de parâmetros, mas sim que o número e a natureza dos parâmetros são flexÃveis e não fixados antecipadamente. Um histograma é um exemplo de estimativa não paramétrica de uma distribuição de probabilidade.
Entendendo as EstatÃsticas Não Paramétricas
Em estatÃstica, a estatÃstica paramétrica inclui parâmetros como média, desvio padrão, correlação de Pearson, variância, etc. Esta forma de estatÃstica usa os dados observados para estimar os parâmetros da distribuição. Sob estatÃsticas paramétricas, os dados são frequentemente assumidos como provenientes de uma distribuição normal com parâmetros desconhecidos μ (média populacional) e σ2 (variância populacional), que são então estimados usando a média amostral e a variância amostral.
As estatÃsticas não paramétricas não fazem suposições sobre o tamanho da amostra ou se os dados observados são quantitativos.
A estatÃstica não paramétrica não pressupõe que os dados sejam extraÃdos de uma distribuição normal. Em vez disso, a forma da distribuição é estimada sob essa forma de medição estatÃstica. Embora existam muitas situações em que uma distribuição normal pode ser assumida, também existem alguns cenários em que o verdadeiro processo de geração de dados está longe de ser distribuÃdo normalmente.
Exemplos de estatÃsticas não paramétricas
No primeiro exemplo, considere um analista financeiro que deseja estimar o valor em risco (VaR) de um investimento. O analista reúne dados de ganhos de centenas de investimentos semelhantes em um horizonte de tempo semelhante. Em vez de assumir que os ganhos seguem uma distribuição normal, eles usam o histograma para estimar a distribuição de forma não paramétrica. O percentil 5 deste histograma fornece então ao analista uma estimativa não paramétrica do VaR.
Para um segundo exemplo, considere um pesquisador diferente que deseja saber se a média de horas de sono está ligada à frequência com que alguém adoece. Como muitas pessoas adoecem raramente, se é que adoecem, e ocasionalmente outras adoecem com muito mais frequência do que a maioria das outras, a distribuição da frequência da doença é claramente não normal, sendo assimétrica à direita e propensa a valores discrepantes. Assim, ao invés de usar um método que assume uma distribuição normal para a frequência de doença, como é feito na análise de regressão clássica, por exemplo, o pesquisador decide usar um método não paramétrico como a análise de regressão quantÃlica.
Considerações Especiais
As estatÃsticas não paramétricas ganharam reconhecimento devido à sua facilidade de uso. À medida que a necessidade de parâmetros é aliviada, os dados se tornam mais aplicáveis a uma variedade maior de testes. Esse tipo de estatÃstica pode ser usado sem a média, tamanho da amostra, desvio padrão ou a estimativa de quaisquer outros parâmetros relacionados quando nenhuma dessas informações estiver disponÃvel.
Como as estatÃsticas não paramétricas fazem menos suposições sobre os dados de amostra, sua aplicação é mais ampla em escopo do que as estatÃsticas paramétricas. Nos casos em que os testes paramétricos são mais apropriados, os métodos não paramétricos serão menos eficientes. Isso ocorre porque as estatÃsticas não paramétricas descartam algumas informações que estão disponÃveis nos dados, diferentemente das estatÃsticas paramétricas.
##Destaques
Esse tipo de análise geralmente é mais adequado ao considerar a ordem de algo, onde, mesmo que os dados numéricos mudem, os resultados provavelmente permanecerão os mesmos.
As estatÃsticas não paramétricas são fáceis de usar, mas não oferecem a precisão exata de outros modelos estatÃsticos.