Investor's wiki

Corrélation fallacieuse

Corrélation fallacieuse

Qu'est-ce qu'une fausse corrélation ?

En statistique,. une fausse corrélation (ou fausseté) fait référence à un lien entre deux variables qui semble être causal mais qui ne l'est pas. Avec une fausse corrélation, toutes les dépendances observées entre les variables sont simplement dues au hasard ou sont toutes deux liées à un facteur de confusion invisible.

Comprendre la fausse corrélation

De fausses relations apparaîtront initialement pour montrer qu'une variable affecte directement une autre, mais ce n'est pas le cas. Cette corrélation trompeuse est souvent causée par un troisième facteur qui n'est pas apparent au moment de l'examen, parfois appelé un facteur de confusion.

Lorsque deux variables aléatoires se suivent de près sur un graphique, il est facile de soupçonner une corrélation lorsqu'un changement dans une variable entraîne un changement dans l'autre variable. Mis à part la causalité, qui est un autre sujet, cette observation peut amener le lecteur du graphique à croire que le mouvement de la variable A est lié au mouvement de la variable B ou vice versa.

Cependant, un examen statistique plus approfondi peut montrer que les mouvements alignés sont une coïncidence ou sont causés par un troisième facteur qui affecte les deux variables. Il s'agit d'une fausse corrélation. Les recherches menées avec des échantillons de petite taille ou des paramètres arbitraires sont particulièrement susceptibles d'être fausses.

Repérer la fausseté

La façon la plus évidente de repérer une fausse relation dans les résultats de la recherche est d'utiliser le bon sens. Ce n'est pas parce que deux choses se produisent et semblent être liées qu'il n'y a pas d'autres facteurs à l'œuvre. Cependant, pour être sûr, les méthodes de recherche sont examinées de manière critique.

Dans les études, toutes les variables susceptibles d'avoir un impact sur les résultats doivent être incluses dans le modèle statistique afin de contrôler leur impact sur la variable dépendante.

Corrélation fallacieuse

De nombreuses relations fallacieuses peuvent être identifiées en utilisant le bon sens. Si une corrélation est trouvée, il y a généralement plus d'une variable en jeu, et les variables ne sont souvent pas immédiatement évidentes.

Exemples de corrélations fallacieuses

Des corrélations intéressantes sont faciles à trouver, mais beaucoup se révéleront fausses. Trois exemples sont la théorie de la longueur de la jupe, l'indicateur du super bol et une corrélation suggérée entre les taux d'achèvement de la course et de l'université.

  1. Théorie de la longueur de la jupe : née dans les années 1920, la théorie de la longueur de la jupe soutient que la longueur de la jupe et la direction du marché boursier sont corrélées. Si la longueur des jupes est longue, la corrélation est que le marché boursier est baissier. Si la longueur des chemises est courte, le marché est haussier.

  2. Indicateur du Super Bowl : Fin janvier, on parle souvent du soi-disant indicateur du Super Bowl, ce qui suggère qu'une victoire de l'équipe de l'American Football Conference signifie probablement que le marché boursier baissera dans les prochains mois. année, alors qu'une victoire de l'équipe de la Conférence nationale de football laisse présager une hausse du marché. Depuis le début de l'ère du Super Bowl, l'indicateur a été précis environ 74 % du temps, soit 40 des 54 années, selon OpenMarkets. C'est un sujet de conversation amusant, mais probablement pas quelque chose qu'un conseiller financier sérieux recommanderait comme stratégie d'investissement pour ses clients.

  3. Niveau d'instruction et race : les spécialistes des sciences sociales se sont concentrés sur l'identification des variables ayant un impact sur le niveau d'instruction. Selon une étude gouvernementale, 56 % des Blancs de 25 à 29 ans avaient obtenu un diplôme universitaire en 2019, contre seulement 36 % des Noirs du même âge. L'implication étant que la race a un effet causal sur les taux d'achèvement des études collégiales.

Cependant, ce n'est peut-être pas la race elle-même qui influe sur le niveau d'instruction. Les résultats peuvent également être dus aux effets du racisme dans la société, qui pourrait être la troisième variable "cachée". Le racisme a un impact sur les personnes de couleur, les désavantageant sur le plan éducatif et économique. Par exemple, les écoles des communautés non blanches sont confrontées à de plus grands défis et reçoivent moins de financement, les parents des populations non blanches ont des emplois moins bien rémunérés et moins de ressources à consacrer à l'éducation de leurs enfants, et de nombreuses familles vivent dans des déserts alimentaires et souffrent de malnutrition. . Le racisme, plutôt que la race, pourrait être considéré comme une variable causale qui influe sur le niveau de scolarité.

Points forts

  • L'apparition d'une relation causale est souvent due à un mouvement similaire sur un graphique qui s'avère être une coïncidence ou causé par un troisième facteur "confondant".

  • Une fausse corrélation, ou fausseté, se produit lorsque deux facteurs semblent liés l'un à l'autre mais ne le sont pas.

  • La confirmation d'une relation causale nécessite une étude qui contrôle toutes les variables possibles.

  • Les statisticiens et les scientifiques utilisent une analyse statistique minutieuse pour déterminer les relations fallacieuses.

  • Une fausse corrélation peut être causée par des échantillons de petite taille ou des paramètres arbitraires.

FAQ

Qu'est-ce qu'une fausse régression ?

La régression factice est un modèle statistique qui montre des preuves statistiques trompeuses d'une relation linéaire; en d'autres termes, une fausse corrélation entre des variables indépendantes non stationnaires.

Qu'est-ce qu'un exemple de corrélation mais pas de causalité ?

Un exemple de corrélation est que plus de sommeil entraîne de meilleures performances pendant la journée. Bien qu'il y ait une corrélation, il n'y a pas nécessairement de causalité. Plus de sommeil n'est peut-être pas la raison pour laquelle un individu est plus performant ; par exemple, ils utilisent peut-être un nouvel outil logiciel qui augmente leur productivité. Pour trouver la causalité, il doit y avoir des preuves factuelles d'une étude qui montre une relation causale entre le sommeil et la performance.

Comment repérer une fausse corrélation ?

Les statisticiens et autres scientifiques qui analysent les données doivent être constamment à l'affût des relations fallacieuses. Il existe de nombreuses méthodes qu'ils utilisent pour les identifier, notamment : - Garantir un échantillon représentatif approprié- Obtenir une taille d'échantillon adéquate- Se méfier des paramètres arbitraires- Contrôle du plus grand nombre de variables extérieures possible- Utiliser une hypothèse nulle et vérifier un p fort -évaluer

Qu'est-ce que la fausse causalité ?

La fausse causalité fait référence à l'hypothèse faite qu'une chose en cause une autre en raison d'une relation entre elles. Par exemple, nous pouvons supposer qu'Harry s'est entraîné dur pour devenir un coureur plus rapide parce que ses temps de course se sont améliorés. Cependant, la réalité pourrait être que les temps de course de Harry se sont améliorés parce qu'il a de nouvelles chaussures de course fabriquées avec les dernières technologies. L'hypothèse initiale était une fausse causalité.