Significancia estadística
¿Qué es la significación estadÃstica?
La significancia estadÃstica se refiere a la afirmación de que un conjunto de datos observados no son el resultado de la casualidad, sino que pueden atribuirse a una causa especÃfica. La importancia estadÃstica es importante para las disciplinas académicas o los profesionales que dependen en gran medida del análisis de datos y la investigación, como la economÃa, las finanzas,. las inversiones,. la medicina, la fÃsica y la biologÃa.
La significación estadÃstica puede considerarse fuerte o débil. Al analizar un conjunto de datos y realizar las pruebas necesarias para discernir si una o más variables tienen un efecto en un resultado, una fuerte significación estadÃstica ayuda a respaldar el hecho de que los resultados son reales y no causados por la suerte o el azar. En pocas palabras, si un valor p es pequeño, el resultado se considera más fiable.
Los problemas surgen en las pruebas de significancia estadÃstica porque los investigadores generalmente trabajan con muestras de poblaciones más grandes y no con las poblaciones mismas. Como resultado, las muestras deben ser representativas de la población, por lo que los datos contenidos en la muestra no deben estar sesgados de ninguna manera. En la mayorÃa de las ciencias, incluida la economÃa, un resultado puede considerarse estadÃsticamente significativo si tiene un nivel de confianza del 95 % (o, a veces, del 99 %).
Comprender la importancia estadÃstica
El cálculo de la significancia estadÃstica (prueba de significación) está sujeto a un cierto grado de error. Incluso si los datos parecen tener una fuerte relación, los investigadores deben tener en cuenta la posibilidad de que surgiera una aparente correlación debido al azar o a un error de muestreo.
El tamaño de la muestra es un componente importante de la significación estadÃstica, ya que las muestras más grandes son menos propensas a los trematodos. Solo se deben usar muestras representativas elegidas al azar en las pruebas de significancia. El nivel en el que se puede aceptar si un evento es estadÃsticamente significativo se conoce como nivel de significación.
Los investigadores utilizan una medida conocida como valor p para determinar la significancia estadÃstica: si el valor p cae por debajo del nivel de significancia, entonces el resultado es estadÃsticamente significativo. El valor p es una función de las medias y las desviaciones estándar de las muestras de datos.
El valor p indica la probabilidad bajo la cual ocurrió el resultado estadÃstico dado, asumiendo que solo el azar es responsable del resultado. Si esta probabilidad es pequeña, entonces el investigador puede concluir que algún otro factor podrÃa ser responsable de los datos observados.
Lo contrario del nivel de significancia, calculado como 1 menos el nivel de significancia, es el nivel de confianza. Indica el grado de confianza de que el resultado estadÃstico no se produjo por casualidad o por error de muestreo. El nivel de confianza habitual en muchas pruebas estadÃsticas es del 95 %, lo que lleva a un nivel de significación habitual o valor p del 5 %.
"P-hacking" es la práctica de comparar exhaustivamente muchos conjuntos de datos diferentes en busca de un resultado estadÃsticamente significativo. Esto está sujeto al sesgo de informe porque los investigadores solo informan resultados favorables, no negativos.
Consideraciones Especiales
La importancia estadÃstica no siempre indica una importancia práctica, lo que significa que los resultados no se pueden aplicar a situaciones comerciales del mundo real. Además, la significación estadÃstica puede malinterpretarse cuando los investigadores no usan el lenguaje con cuidado al informar sus resultados. El hecho de que un resultado sea estadÃsticamente significativo no implica que no sea el resultado de la casualidad, solo que es menos probable que sea asÃ.
El hecho de que dos series de datos tengan una fuerte correlación entre sà no implica causalidad. Por ejemplo, la cantidad de pelÃculas que protagoniza el actor Nicolas Cage en un año determinado está muy relacionada con la cantidad de ahogamientos accidentales en piscinas. Pero esta correlación es espuria ya que no se puede hacer ninguna afirmación causal teórica.
Otro problema que puede surgir con la significancia estadÃstica es que los datos pasados y los resultados de esos datos, ya sean estadÃsticamente significativos o no, pueden no reflejar las condiciones actuales o futuras. Al invertir, esto puede manifestarse en un modelo de fijación de precios que se rompe durante tiempos de crisis financiera, ya que las correlaciones cambian y las variables no interactúan como de costumbre. La importancia estadÃstica también puede ayudar a un inversor a discernir si un modelo de valoración de activos es mejor que otro.
Tipos de pruebas de significación estadÃstica
Se utilizan varios tipos de pruebas de significancia dependiendo de la investigación que se realice. Por ejemplo, se pueden emplear pruebas para una, dos o más muestras de datos de varios tamaños para promedios, varianzas, proporciones, datos emparejados o no emparejados o diferentes distribuciones de datos.
También existen diferentes enfoques para las pruebas de significación, según el tipo de datos que esté disponible. A Ronald Fisher se le atribuye la formulación de uno de los enfoques más flexibles, además de establecer la norma de significación en p < 0,05. Debido a que la mayor parte del trabajo se puede realizar después de recopilar los datos, este método sigue siendo popular para proyectos de investigación a corto plazo o ad hoc.
Buscando construir sobre el método de Fisher, Jerzy Neyman y Egon Pearson terminaron desarrollando un enfoque alternativo. Este método requiere más trabajo antes de recopilar los datos, pero permite a los investigadores diseñar su estudio de manera que controle la probabilidad de llegar a conclusiones falsas.
Prueba de hipótesis nula
La significación estadÃstica se utiliza en las pruebas de hipótesis nulas en las que los investigadores intentan respaldar sus teorÃas rechazando otras explicaciones. Aunque el método a veces se malinterpreta, sigue siendo el método más popular de prueba de datos en medicina, psicologÃa y otros campos.
La hipótesis nula más común es que el parámetro en cuestión es igual a cero (lo que normalmente indica que una variable tiene un efecto cero en el resultado de interés). Si los investigadores rechazan la hipótesis nula con una confianza del 95 % o más, pueden afirmar que una relación observada es estadÃsticamente significativa. Las hipótesis nulas también se pueden probar para la igualdad de efecto para dos o más tratamientos alternativos.
Contrariamente al concepto erróneo popular, un alto nivel de significación estadÃstica no puede probar que una hipótesis sea verdadera o falsa. En realidad, la significación estadÃstica mide la probabilidad de que se hubiera producido un resultado observado, suponiendo que la hipótesis nula es verdadera.
El rechazo de la hipótesis nula, incluso si un grado muy alto de significancia estadÃstica nunca puede probar algo, solo puede agregar apoyo a una hipótesis existente. Por otro lado, el hecho de no rechazar una hipótesis nula a menudo es motivo para descartar una hipótesis.
Además, un efecto puede ser estadÃsticamente significativo pero tener solo un impacto muy pequeño. Por ejemplo, puede ser estadÃsticamente significativo que las empresas que usan papel higiénico de dos capas en sus baños tengan empleados más productivos, pero es probable que la mejora en la productividad absoluta de cada trabajador sea minúscula.
Corrección: 15 de mayo de 2022: Este artÃculo se editó para resaltar las posibles falacias en las pruebas de significancia.
Reflejos
La importancia estadÃstica se refiere a la afirmación de que es probable que un resultado de los datos generados por pruebas o experimentación sea atribuible a una causa especÃfica.
El cálculo de la significación estadÃstica está sujeto a cierto grado de error.
Un alto grado de significación estadÃstica indica que es poco probable que una relación observada se deba al azar.
Se utilizan varios tipos de pruebas de significación dependiendo de la investigación que se esté realizando.
La significación estadÃstica puede malinterpretarse cuando los investigadores no usan el lenguaje con cuidado al informar sus resultados.