Correlación espuria
驴Qu茅 es la correlaci贸n espuria?
En estad铆stica,. una correlaci贸n espuria (o espuria) se refiere a una conexi贸n entre dos variables que parece ser causal pero no lo es. Con la correlaci贸n espuria, cualquier dependencia observada entre las variables se debe simplemente al azar o ambas est谩n relacionadas con alg煤n factor de confusi贸n invisible.
Comprender la correlaci贸n espuria
Las relaciones espurias aparecer谩n inicialmente para mostrar que una variable afecta directamente a otra, pero ese no es el caso. Esta correlaci贸n enga帽osa a menudo es causada por un tercer factor que no es evidente en el momento del examen, a veces llamado factor de confusi贸n.
Cuando dos variables aleatorias se siguen de cerca en un gr谩fico, es f谩cil sospechar una correlaci贸n donde un cambio en una variable provoca un cambio en la otra variable. Dejando de lado la causalidad, que es otro tema, esta observaci贸n puede llevar al lector del gr谩fico a creer que el movimiento de la variable A est谩 vinculado al movimiento de la variable B o viceversa.
Sin embargo, un examen estad铆stico m谩s detenido puede mostrar que los movimientos alineados son coincidentes o causados por un tercer factor que afecta las dos variables. Esta es una correlaci贸n espuria. La investigaci贸n realizada con tama帽os de muestra peque帽os o puntos finales arbitrarios es particularmente susceptible a la falsedad.
Detecci贸n de falsedad
La forma m谩s obvia de detectar una relaci贸n espuria en los resultados de la investigaci贸n es usar el sentido com煤n. El hecho de que dos cosas ocurran y parezcan estar vinculadas no significa que no haya otros factores en juego. Sin embargo, para estar seguro, los m茅todos de investigaci贸n se examinan cr铆ticamente.
En los estudios, todas las variables que puedan afectar los hallazgos deben incluirse en el modelo estad铆stico para controlar su impacto en la variable dependiente.
Correlaci贸n espuria
Muchas relaciones espurias se pueden identificar utilizando el sentido com煤n. Si se encuentra una correlaci贸n, generalmente hay m谩s de una variable en juego, y las variables a menudo no son inmediatamente obvias.
Ejemplos de correlaci贸n espuria
Las correlaciones interesantes son f谩ciles de encontrar, pero muchas resultar谩n ser falsas. Tres ejemplos son la teor铆a de la longitud de la falda, el indicador del super bowl y una correlaci贸n sugerida entre la raza y las tasas de finalizaci贸n de la universidad.
Teor铆a de la longitud de la falda: Con origen en la d茅cada de 1920, la teor铆a de la longitud de la falda sostiene que la longitud de la falda y la direcci贸n del mercado de valores est谩n correlacionadas. Si las faldas son largas, la correlaci贸n es que el mercado de valores es bajista. Si las camisas son cortas, el mercado es alcista.
Indicador del Super Bowl: a fines de enero, a menudo se habla del llamado indicador del Super Bowl, que sugiere que una victoria del equipo de la Conferencia de F煤tbol Americano probablemente signifique que el mercado de valores bajar谩 en los pr贸ximos a帽o, mientras que una victoria del equipo de la Conferencia Nacional de F煤tbol presagia un aumento en el mercado. Desde el comienzo de la era del Super Bowl, el indicador ha sido preciso alrededor del 74 % de las veces, o 40 de los 54 a帽os, seg煤n OpenMarkets. Es un tema de conversaci贸n divertido, pero probablemente no sea algo que un asesor financiero serio recomendar铆a como estrategia de inversi贸n para los clientes.
Logro educativo y raza: Los cient铆ficos sociales se han centrado en identificar qu茅 variables afectan el logro educativo. Seg煤n una investigaci贸n del gobierno, el 56 % de los blancos de entre 25 y 29 a帽os hab铆an completado un t铆tulo universitario en 2019, en comparaci贸n con solo el 36 % de las personas negras de la misma edad. La implicaci贸n es que la raza tiene un efecto causal en las tasas de finalizaci贸n de la universidad.
Sin embargo, puede que no sea la raza en s铆 misma la que afecte el logro educativo. Los resultados tambi茅n pueden deberse a los efectos del racismo en la sociedad, que podr铆a ser la tercera variable "oculta". El racismo afecta a las personas de color, coloc谩ndolas en desventaja educativa y econ贸mica. Por ejemplo, las escuelas en comunidades no blancas enfrentan mayores desaf铆os y reciben menos fondos, los padres en poblaciones no blancas tienen trabajos peor pagados y menos recursos para dedicar a la educaci贸n de sus hijos, y muchas familias viven en desiertos alimentarios y sufren de desnutrici贸n. . El racismo, en lugar de la raza, podr铆a verse como una variable causal que afecta el logro educativo.
Reflejos
La aparici贸n de una relaci贸n causal a menudo se debe a un movimiento similar en un gr谩fico que resulta ser coincidente o causado por un tercer factor de "confusi贸n".
La correlaci贸n espuria, o espuria, ocurre cuando dos factores parecen casualmente relacionados entre s铆 pero no lo est谩n.
Confirmar una relaci贸n causal requiere un estudio que controle todas las variables posibles.
Los estad铆sticos y cient铆ficos utilizan un an谩lisis estad铆stico cuidadoso para determinar relaciones espurias.
La correlaci贸n espuria puede deberse a tama帽os de muestra peque帽os o puntos finales arbitrarios.
PREGUNTAS M脕S FRECUENTES
驴Qu茅 es la regresi贸n espuria?
La regresi贸n espuria es un modelo estad铆stico que muestra evidencia estad铆stica enga帽osa de una relaci贸n lineal; en otras palabras, una correlaci贸n espuria entre variables independientes no estacionarias.
驴Qu茅 es un ejemplo de correlaci贸n pero no de causalidad?
Un ejemplo de una correlaci贸n es que dormir m谩s conduce a un mejor rendimiento durante el d铆a. Aunque hay una correlaci贸n, no necesariamente hay causalidad. Dormir m谩s puede no ser la raz贸n por la que un individuo se desempe帽a mejor; por ejemplo, podr铆an estar utilizando una nueva herramienta de software que est谩 aumentando su productividad. Para encontrar causalidad, debe haber evidencia f谩ctica de un estudio que muestre una relaci贸n causal entre el sue帽o y el rendimiento.
驴C贸mo detectar una correlaci贸n espuria?
Los estad铆sticos y otros cient铆ficos que analizan datos deben estar atentos a relaciones espurias todo el tiempo. Existen numerosos m茅todos que utilizan para identificarlos, entre ellos: - Asegurar una muestra representativa adecuada - Obtener un tama帽o de muestra adecuado - Desconfiar de los puntos finales arbitrarios - Controlar tantas variables externas como sea posible - Usar una hip贸tesis nula y verificar una p fuerte -valor
驴Qu茅 es la falsa causalidad?
La falsa causalidad se refiere a la suposici贸n que se hace de que una cosa causa otra debido a una relaci贸n entre ellas. Por ejemplo, podemos suponer que Harry ha estado entrenando duro para convertirse en un corredor m谩s r谩pido porque sus tiempos de carrera han mejorado. Sin embargo, la realidad podr铆a ser que los tiempos de carrera de Harry han mejorado porque tiene nuevos zapatos para correr hechos con la 煤ltima tecnolog铆a. La suposici贸n inicial era una causalidad falsa.