Significancia estadística

¿Qué es la significación estadística?

La significancia estadística se refiere a la afirmación de que un conjunto de datos observados no son el resultado de la casualidad, sino que pueden atribuirse a una causa específica. La importancia estadística es importante para las disciplinas académicas o los profesionales que dependen en gran medida del análisis de datos y la investigación, como la economía, las finanzas,. las inversiones,. la medicina, la física y la biología.

La significación estadística puede considerarse fuerte o débil. Al analizar un conjunto de datos y realizar las pruebas necesarias para discernir si una o más variables tienen un efecto en un resultado, una fuerte significación estadística ayuda a respaldar el hecho de que los resultados son reales y no causados por la suerte o el azar. En pocas palabras, si un valor p es pequeño, el resultado se considera más fiable.

Los problemas surgen en las pruebas de significancia estadística porque los investigadores generalmente trabajan con muestras de poblaciones más grandes y no con las poblaciones mismas. Como resultado, las muestras deben ser representativas de la población, por lo que los datos contenidos en la muestra no deben estar sesgados de ninguna manera. En la mayoría de las ciencias, incluida la economía, un resultado puede considerarse estadísticamente significativo si tiene un nivel de confianza del 95 % (o, a veces, del 99 %).

Comprender la importancia estadística

El cálculo de la significancia estadística (prueba de significación) está sujeto a un cierto grado de error. Incluso si los datos parecen tener una fuerte relación, los investigadores deben tener en cuenta la posibilidad de que surgiera una aparente correlación debido al azar o a un error de muestreo.

El tamaño de la muestra es un componente importante de la significación estadística, ya que las muestras más grandes son menos propensas a los trematodos. Solo se deben usar muestras representativas elegidas al azar en las pruebas de significancia. El nivel en el que se puede aceptar si un evento es estadísticamente significativo se conoce como nivel de significación.

Los investigadores utilizan una medida conocida como valor p para determinar la significancia estadística: si el valor p cae por debajo del nivel de significancia, entonces el resultado es estadísticamente significativo. El valor p es una función de las medias y las desviaciones estándar de las muestras de datos.

El valor p indica la probabilidad bajo la cual ocurrió el resultado estadístico dado, asumiendo que solo el azar es responsable del resultado. Si esta probabilidad es pequeña, entonces el investigador puede concluir que algún otro factor podría ser responsable de los datos observados.

Lo contrario del nivel de significancia, calculado como 1 menos el nivel de significancia, es el nivel de confianza. Indica el grado de confianza de que el resultado estadístico no se produjo por casualidad o por error de muestreo. El nivel de confianza habitual en muchas pruebas estadísticas es del 95 %, lo que lleva a un nivel de significación habitual o valor p del 5 %.

"P-hacking" es la práctica de comparar exhaustivamente muchos conjuntos de datos diferentes en busca de un resultado estadísticamente significativo. Esto está sujeto al sesgo de informe porque los investigadores solo informan resultados favorables, no negativos.

Consideraciones Especiales

La importancia estadística no siempre indica una importancia práctica, lo que significa que los resultados no se pueden aplicar a situaciones comerciales del mundo real. Además, la significación estadística puede malinterpretarse cuando los investigadores no usan el lenguaje con cuidado al informar sus resultados. El hecho de que un resultado sea estadísticamente significativo no implica que no sea el resultado de la casualidad, solo que es menos probable que sea así.

El hecho de que dos series de datos tengan una fuerte correlación entre sí no implica causalidad. Por ejemplo, la cantidad de películas que protagoniza el actor Nicolas Cage en un año determinado está muy relacionada con la cantidad de ahogamientos accidentales en piscinas. Pero esta correlación es espuria ya que no se puede hacer ninguna afirmación causal teórica.

Otro problema que puede surgir con la significancia estadística es que los datos pasados y los resultados de esos datos, ya sean estadísticamente significativos o no, pueden no reflejar las condiciones actuales o futuras. Al invertir, esto puede manifestarse en un modelo de fijación de precios que se rompe durante tiempos de crisis financiera, ya que las correlaciones cambian y las variables no interactúan como de costumbre. La importancia estadística también puede ayudar a un inversor a discernir si un modelo de valoración de activos es mejor que otro.

Tipos de pruebas de significación estadística

Se utilizan varios tipos de pruebas de significancia dependiendo de la investigación que se realice. Por ejemplo, se pueden emplear pruebas para una, dos o más muestras de datos de varios tamaños para promedios, varianzas, proporciones, datos emparejados o no emparejados o diferentes distribuciones de datos.

También existen diferentes enfoques para las pruebas de significación, según el tipo de datos que esté disponible. A Ronald Fisher se le atribuye la formulación de uno de los enfoques más flexibles, además de establecer la norma de significación en p < 0,05. Debido a que la mayor parte del trabajo se puede realizar después de recopilar los datos, este método sigue siendo popular para proyectos de investigación a corto plazo o ad hoc.

Buscando construir sobre el método de Fisher, Jerzy Neyman y Egon Pearson terminaron desarrollando un enfoque alternativo. Este método requiere más trabajo antes de recopilar los datos, pero permite a los investigadores diseñar su estudio de manera que controle la probabilidad de llegar a conclusiones falsas.

Prueba de hipótesis nula

La significación estadística se utiliza en las pruebas de hipótesis nulas en las que los investigadores intentan respaldar sus teorías rechazando otras explicaciones. Aunque el método a veces se malinterpreta, sigue siendo el método más popular de prueba de datos en medicina, psicología y otros campos.

La hipótesis nula más común es que el parámetro en cuestión es igual a cero (lo que normalmente indica que una variable tiene un efecto cero en el resultado de interés). Si los investigadores rechazan la hipótesis nula con una confianza del 95 % o más, pueden afirmar que una relación observada es estadísticamente significativa. Las hipótesis nulas también se pueden probar para la igualdad de efecto para dos o más tratamientos alternativos.

Contrariamente al concepto erróneo popular, un alto nivel de significación estadística no puede probar que una hipótesis sea verdadera o falsa. En realidad, la significación estadística mide la probabilidad de que se hubiera producido un resultado observado, suponiendo que la hipótesis nula es verdadera.

El rechazo de la hipótesis nula, incluso si un grado muy alto de significancia estadística nunca puede probar algo, solo puede agregar apoyo a una hipótesis existente. Por otro lado, el hecho de no rechazar una hipótesis nula a menudo es motivo para descartar una hipótesis.

Además, un efecto puede ser estadísticamente significativo pero tener solo un impacto muy pequeño. Por ejemplo, puede ser estadísticamente significativo que las empresas que usan papel higiénico de dos capas en sus baños tengan empleados más productivos, pero es probable que la mejora en la productividad absoluta de cada trabajador sea minúscula.

Corrección: 15 de mayo de 2022: Este artículo se editó para resaltar las posibles falacias en las pruebas de significancia.

Reflejos

La importancia estadística se refiere a la afirmación de que es probable que un resultado de los datos generados por pruebas o experimentación sea atribuible a una causa específica.
El cálculo de la significación estadística está sujeto a cierto grado de error.
Un alto grado de significación estadística indica que es poco probable que una relación observada se deba al azar.
Se utilizan varios tipos de pruebas de significación dependiendo de la investigación que se esté realizando.
La significación estadística puede malinterpretarse cuando los investigadores no usan el lenguaje con cuidado al informar sus resultados.