Estadísticas no paramétricas

¿Qué son las estadísticas no paramétricas?

Las estadísticas no paramétricas se refieren a un método estadístico en el que no se asume que los datos provienen de modelos prescritos que están determinados por una pequeña cantidad de parámetros; ejemplos de tales modelos incluyen el modelo de distribución normal y el modelo de regresión lineal. Las estadísticas no paramétricas a veces usan datos que son ordinales, lo que significa que no se basan en números, sino en una clasificación u orden de clases. Por ejemplo, una encuesta que transmita las preferencias de los consumidores que van desde el agrado hasta el desagrado se consideraría información ordinal.

Las estadísticas no paramétricas incluyen estadísticas descriptivas no paramétricas,. modelos estadísticos, inferencia y pruebas estadísticas. La estructura del modelo de los modelos no paramétricos no se especifica a priori, sino que se determina a partir de los datos. El término no paramétrico no implica que dichos modelos carezcan por completo de parámetros, sino que el número y la naturaleza de los parámetros son flexibles y no están fijados de antemano. Un histograma es un ejemplo de una estimación no paramétrica de una distribución de probabilidad.

Comprender las estadísticas no paramétricas

En estadística, las estadísticas paramétricas incluyen parámetros como la media, la desviación estándar, la correlación de Pearson, la varianza, etc. Esta forma de estadística utiliza los datos observados para estimar los parámetros de la distribución. Según las estadísticas paramétricas, a menudo se supone que los datos provienen de una distribución normal con parámetros desconocidos μ (media de la población) y σ2 (varianza de la población), que luego se estiman utilizando la media de la muestra y la varianza de la muestra.

Las estadísticas no paramétricas no hacen suposiciones sobre el tamaño de la muestra o si los datos observados son cuantitativos.

Las estadísticas no paramétricas no asumen que los datos se extraen de una distribución normal. En cambio, la forma de la distribución se estima bajo esta forma de medición estadística. Si bien hay muchas situaciones en las que se puede suponer una distribución normal, también hay algunos escenarios en los que el verdadero proceso de generación de datos está lejos de distribuirse normalmente.

Ejemplos de estadísticas no paramétricas

En el primer ejemplo, considere a un analista financiero que desea estimar el valor en riesgo (VaR) de una inversión. El analista recopila datos de ganancias de cientos de inversiones similares durante un horizonte de tiempo similar. En lugar de suponer que las ganancias siguen una distribución normal, utilizan el histograma para estimar la distribución de forma no paramétrica. El percentil 5 de este histograma proporciona al analista una estimación no paramétrica del VaR.

Para un segundo ejemplo, considere a un investigador diferente que quiere saber si el promedio de horas de sueño está relacionado con la frecuencia con la que uno se enferma. Debido a que muchas personas rara vez se enferman, si es que lo hacen, y ocasionalmente otras se enferman con mucha más frecuencia que la mayoría, la distribución de la frecuencia de la enfermedad claramente no es normal, está sesgada hacia la derecha y es propensa a valores atípicos. Por lo tanto, en lugar de utilizar un método que supone una distribución normal para la frecuencia de la enfermedad, como se hace en el análisis de regresión clásico, por ejemplo, el investigador decide utilizar un método no paramétrico como el análisis de regresión por cuantiles.

Consideraciones Especiales

Las estadísticas no paramétricas han ganado reconocimiento debido a su facilidad de uso. A medida que se elimina la necesidad de parámetros, los datos se vuelven más aplicables a una mayor variedad de pruebas. Este tipo de estadística se puede utilizar sin la media, el tamaño de la muestra, la desviación estándar o la estimación de cualquier otro parámetro relacionado cuando no se dispone de esa información.

Dado que las estadísticas no paramétricas hacen menos suposiciones sobre los datos de muestra, su aplicación tiene un alcance más amplio que las estadísticas paramétricas. En los casos en que las pruebas paramétricas sean más apropiadas, los métodos no paramétricos serán menos eficientes. Esto se debe a que las estadísticas no paramétricas descartan parte de la información que está disponible en los datos, a diferencia de las estadísticas paramétricas.

Reflejos

Este tipo de análisis suele ser más adecuado cuando se considera el orden de algo, donde incluso si los datos numéricos cambian, es probable que los resultados permanezcan iguales.
Las estadísticas no paramétricas son fáciles de usar, pero no ofrecen la precisión milimétrica de otros modelos estadísticos.