Método não paramétrico
O que é o método não paramétrico?
O método não paramétrico refere-se a um tipo de estatística que não faz suposições sobre as características da amostra (seus parâmetros) ou se os dados observados são quantitativos ou qualitativos.
Estatísticas não paramétricas podem incluir certas estatísticas descritivas,. modelos estatísticos, inferência e testes estatísticos. A estrutura do modelo de métodos não paramétricos não é especificada a priori, mas é determinada a partir de dados.
O termo "não paramétrico" não significa que tais modelos carecem completamente de parâmetros, mas sim que o número e a natureza dos parâmetros são flexíveis e não fixados antecipadamente. Um histograma é um exemplo de estimativa não paramétrica de uma distribuição de probabilidade.
Em contraste, métodos estatísticos bem conhecidos, como ANOVA,. correlação de Pearson,. teste t e outros, fazem suposições sobre os dados que estão sendo analisados. Uma das suposições paramétricas mais comuns é que os dados populacionais têm uma " distribuição normal ".
Como funciona o método não paramétrico
Métodos paramétricos e não paramétricos são frequentemente usados em diferentes tipos de dados. Estatísticas paramétricas geralmente requerem dados de intervalo ou razão. Um exemplo desse tipo de dado é idade, renda, altura e peso em que os valores são contínuos e os intervalos entre os valores têm significado.
Em contraste, as estatísticas não paramétricas são normalmente usadas em dados nominais ou ordinais. Variáveis nominais são variáveis para as quais os valores não possuem valores quantitativos. Variáveis nominais comuns na pesquisa em ciências sociais, por exemplo, incluem sexo, cujos valores possíveis são categorias discretas, “masculino” e “feminino”. situação de emprego (empregado versus desempregado).
Variáveis ordinais são aquelas em que o valor sugere alguma ordem. Um exemplo de variável ordinal seria se um respondente da pesquisa perguntasse: "Em uma escala de 1 a 5, sendo 1 extremamente insatisfeito e 5 extremamente satisfeito, como você classificaria sua experiência com a empresa de TV a cabo?"
as estatísticas paramétricas também podem ser aplicadas a populações com outros tipos de distribuição conhecidos. As estatísticas não paramétricas não exigem que os dados populacionais atendam aos pressupostos exigidos para estatísticas paramétricas. As estatísticas não paramétricas, portanto, se enquadram em uma categoria de estatísticas às vezes referida como livre de distribuição. Muitas vezes, métodos não paramétricos serão usados quando os dados populacionais tiverem uma distribuição desconhecida ou quando o tamanho da amostra for pequeno.
Considerações Especiais
Embora as estatísticas não paramétricas tenham a vantagem de atender a poucas suposições, elas são menos poderosas do que as estatísticas paramétricas. Isso significa que eles podem não mostrar uma relação entre duas variáveis quando de fato existe uma.
As estatísticas não paramétricas ganharam reconhecimento devido à sua facilidade de uso. À medida que a necessidade de parâmetros é aliviada, os dados se tornam mais aplicáveis a uma variedade maior de testes. Esse tipo de estatística pode ser usado sem a média, tamanho da amostra, desvio padrão ou a estimativa de quaisquer outros parâmetros relacionados quando nenhuma dessas informações estiver disponível.
Como as estatísticas não paramétricas fazem menos suposições sobre os dados de amostra, sua aplicação é mais ampla em escopo do que as estatísticas paramétricas. Nos casos em que os testes paramétricos são mais apropriados, os métodos não paramétricos serão menos eficientes. Isso ocorre porque as estatísticas não paramétricas descartam algumas informações que estão disponíveis nos dados, diferentemente das estatísticas paramétricas.
Testes não paramétricos comuns incluem Qui-Quadrado,. teste de soma de postos de Wilcoxon,. teste de Kruskal-Wallis e correlação de ordem de postos de Spearman.
Exemplos do método não paramétrico
Considere um analista financeiro que deseja estimar o valor em risco (VaR) de um investimento. O analista reúne dados de ganhos de centenas de investimentos semelhantes em um horizonte de tempo semelhante. Em vez de assumir que os ganhos seguem uma distribuição normal, ela usa o histograma para estimar a distribuição de forma não paramétrica. O percentil 5 deste histograma fornece então ao analista uma estimativa não paramétrica do VaR.
Para um segundo exemplo, considere um pesquisador diferente que deseja saber se as horas médias de sono estão ligadas à frequência com que alguém adoece. Como muitas pessoas adoecem raramente, se é que adoecem, e ocasionalmente outras adoecem com muito mais frequência do que a maioria das outras, a distribuição da frequência da doença é claramente não normal, sendo assimétrica à direita e propensa a valores discrepantes.
Assim, ao invés de usar um método que assume uma distribuição normal para a frequência de doença, como é feito na análise de regressão clássica, por exemplo, o pesquisador decide usar um método não paramétrico como a análise de regressão quantílica.
##Destaques
Isso contrasta com os métodos paramétricos, que fazem suposições sobre a forma ou as características dos dados. Exemplos de tais métodos incluem o modelo de distribuição normal e o modelo de regressão linear.
O método não paramétrico é um ramo da estatística em que os dados não são assumidos como provenientes de modelos prescritos que são determinados por um pequeno número de parâmetros.
A análise não paramétrica costuma ser mais adequada ao considerar a ordem de algo, onde mesmo que os dados numéricos mudem, os resultados provavelmente permanecerão os mesmos.