Estadísticas no paramétricas
¿Qué son las estadÃsticas no paramétricas?
Las estadÃsticas no paramétricas se refieren a un método estadÃstico en el que no se asume que los datos provienen de modelos prescritos que están determinados por una pequeña cantidad de parámetros; ejemplos de tales modelos incluyen el modelo de distribución normal y el modelo de regresión lineal. Las estadÃsticas no paramétricas a veces usan datos que son ordinales, lo que significa que no se basan en números, sino en una clasificación u orden de clases. Por ejemplo, una encuesta que transmita las preferencias de los consumidores que van desde el agrado hasta el desagrado se considerarÃa información ordinal.
Las estadÃsticas no paramétricas incluyen estadÃsticas descriptivas no paramétricas,. modelos estadÃsticos, inferencia y pruebas estadÃsticas. La estructura del modelo de los modelos no paramétricos no se especifica a priori, sino que se determina a partir de los datos. El término no paramétrico no implica que dichos modelos carezcan por completo de parámetros, sino que el número y la naturaleza de los parámetros son flexibles y no están fijados de antemano. Un histograma es un ejemplo de una estimación no paramétrica de una distribución de probabilidad.
Comprender las estadÃsticas no paramétricas
En estadÃstica, las estadÃsticas paramétricas incluyen parámetros como la media, la desviación estándar, la correlación de Pearson, la varianza, etc. Esta forma de estadÃstica utiliza los datos observados para estimar los parámetros de la distribución. Según las estadÃsticas paramétricas, a menudo se supone que los datos provienen de una distribución normal con parámetros desconocidos μ (media de la población) y σ2 (varianza de la población), que luego se estiman utilizando la media de la muestra y la varianza de la muestra.
Las estadÃsticas no paramétricas no hacen suposiciones sobre el tamaño de la muestra o si los datos observados son cuantitativos.
Las estadÃsticas no paramétricas no asumen que los datos se extraen de una distribución normal. En cambio, la forma de la distribución se estima bajo esta forma de medición estadÃstica. Si bien hay muchas situaciones en las que se puede suponer una distribución normal, también hay algunos escenarios en los que el verdadero proceso de generación de datos está lejos de distribuirse normalmente.
Ejemplos de estadÃsticas no paramétricas
En el primer ejemplo, considere a un analista financiero que desea estimar el valor en riesgo (VaR) de una inversión. El analista recopila datos de ganancias de cientos de inversiones similares durante un horizonte de tiempo similar. En lugar de suponer que las ganancias siguen una distribución normal, utilizan el histograma para estimar la distribución de forma no paramétrica. El percentil 5 de este histograma proporciona al analista una estimación no paramétrica del VaR.
Para un segundo ejemplo, considere a un investigador diferente que quiere saber si el promedio de horas de sueño está relacionado con la frecuencia con la que uno se enferma. Debido a que muchas personas rara vez se enferman, si es que lo hacen, y ocasionalmente otras se enferman con mucha más frecuencia que la mayorÃa, la distribución de la frecuencia de la enfermedad claramente no es normal, está sesgada hacia la derecha y es propensa a valores atÃpicos. Por lo tanto, en lugar de utilizar un método que supone una distribución normal para la frecuencia de la enfermedad, como se hace en el análisis de regresión clásico, por ejemplo, el investigador decide utilizar un método no paramétrico como el análisis de regresión por cuantiles.
Consideraciones Especiales
Las estadÃsticas no paramétricas han ganado reconocimiento debido a su facilidad de uso. A medida que se elimina la necesidad de parámetros, los datos se vuelven más aplicables a una mayor variedad de pruebas. Este tipo de estadÃstica se puede utilizar sin la media, el tamaño de la muestra, la desviación estándar o la estimación de cualquier otro parámetro relacionado cuando no se dispone de esa información.
Dado que las estadÃsticas no paramétricas hacen menos suposiciones sobre los datos de muestra, su aplicación tiene un alcance más amplio que las estadÃsticas paramétricas. En los casos en que las pruebas paramétricas sean más apropiadas, los métodos no paramétricos serán menos eficientes. Esto se debe a que las estadÃsticas no paramétricas descartan parte de la información que está disponible en los datos, a diferencia de las estadÃsticas paramétricas.
Reflejos
Este tipo de análisis suele ser más adecuado cuando se considera el orden de algo, donde incluso si los datos numéricos cambian, es probable que los resultados permanezcan iguales.
Las estadÃsticas no paramétricas son fáciles de usar, pero no ofrecen la precisión milimétrica de otros modelos estadÃsticos.