Falsche Korrelation
Was ist Nebenkorrelation?
In der Statistik bezieht sich eine Scheinkorrelation (oder Scheinkorrelation) auf einen Zusammenhang zwischen zwei Variablen, der kausal erscheint, es aber nicht ist. Bei einer Scheinkorrelation sind alle beobachteten Abhängigkeiten zwischen Variablen lediglich zufällig oder beide mit einem unsichtbaren Confounder verbunden.
Unechte Korrelation verstehen
Unechte Beziehungen scheinen zunächst zu zeigen, dass eine Variable eine andere direkt beeinflusst, aber das ist nicht der Fall. Diese irreführende Korrelation wird häufig durch einen dritten Faktor verursacht, der zum Zeitpunkt der Untersuchung nicht offensichtlich ist, manchmal auch als Störfaktor bezeichnet.
Wenn zwei Zufallsvariablen in einem Diagramm eng aufeinander folgen, ist es leicht, eine Korrelation zu vermuten, bei der eine Änderung in einer Variablen eine Änderung in der anderen Variable verursacht. Abgesehen von der Kausalität, die ein weiteres Thema ist, kann diese Beobachtung den Leser des Diagramms glauben machen, dass die Bewegung der Variablen A mit der Bewegung der Variablen B verbunden ist oder umgekehrt.
Eine genauere statistische Untersuchung kann jedoch zeigen, dass die ausgerichteten Bewegungen zufällig sind oder durch einen dritten Faktor verursacht werden, der die beiden Variablen beeinflusst. Dies ist eine Scheinkorrelation. Forschung, die mit kleinen Stichprobenumfängen oder willkürlichen Endpunkten durchgeführt wird, ist besonders anfällig für Unechtheit.
Unechtheit erkennen
Der naheliegendste Weg, eine falsche Beziehung in Forschungsergebnissen zu erkennen, ist der gesunde Menschenverstand. Nur weil zwei Dinge auftreten und miteinander verbunden zu sein scheinen, heißt das nicht, dass keine anderen Faktoren am Werk sind. Um sicher zu sein, werden Forschungsmethoden jedoch kritisch hinterfragt.
In Studien sollten alle Variablen, die die Ergebnisse beeinflussen könnten, in das statistische Modell aufgenommen werden, um ihren Einfluss auf die abhängige Variable zu kontrollieren.
Scheinkorrelation
Viele falsche Beziehungen können mit gesundem Menschenverstand identifiziert werden. Wenn eine Korrelation gefunden wird, spielt normalerweise mehr als eine Variable eine Rolle, und die Variablen sind oft nicht sofort offensichtlich.
Beispiele für falsche Korrelationen
Interessante Korrelationen sind leicht zu finden, aber viele werden sich als falsch erweisen. Drei Beispiele sind die Theorie der Rocklänge, der Super-Bowl-Indikator und eine vorgeschlagene Korrelation zwischen Rassen- und College-Abschlussquoten.
Rocklängentheorie: Die Rocklängentheorie stammt aus den 1920er Jahren und besagt, dass Rocklängen und Börsenrichtung korrelieren. Wenn Rocklängen lang sind, ist die Korrelation, dass der Aktienmarkt bearish ist. Wenn die Hemdenlängen kurz sind, ist der Markt bullish.
Super-Bowl-Indikator: Ende Januar wird oft über den sogenannten Super-Bowl-Indikator geredet, der darauf hindeutet, dass ein Sieg des American-Football-Conference-Teams wahrscheinlich bedeutet, dass der Aktienmarkt in der kommenden Zeit fallen wird Jahr, wohingegen ein Sieg des Teams der National Football Conference auf einen Anstieg des Marktes hindeutet. Seit Beginn der Super-Bowl-Ära war der Indikator laut OpenMarkets in etwa 74 % der Fälle genau, oder in 40 von 54 Jahren. Es ist ein lustiger Gesprächsstoff, aber wahrscheinlich nichts, was ein seriöser Finanzberater als Anlagestrategie für Kunden empfehlen würde.
Bildungsstand und Rasse: Sozialwissenschaftler haben sich darauf konzentriert, herauszufinden, welche Variablen den Bildungsstand beeinflussen. Laut staatlichen Untersuchungen hatten 56 % der weißen 25- bis 29-Jährigen im Jahr 2019 einen College-Abschluss, verglichen mit nur 36 % der gleichaltrigen Schwarzen. Die Implikation ist, dass die Rasse einen kausalen Effekt auf die College-Abschlussquoten hat.
Es ist jedoch möglicherweise nicht die Rasse selbst, die sich auf das Bildungsniveau auswirkt. Die Ergebnisse können auch auf die Auswirkungen von Rassismus in der Gesellschaft zurückzuführen sein, was die dritte „versteckte“ Variable sein könnte. Rassismus wirkt sich auf People of Color aus und benachteiligt sie bildungstechnisch und wirtschaftlich. Beispielsweise stehen die Schulen in nicht-weißen Gemeinden vor größeren Herausforderungen und erhalten weniger Mittel, Eltern in nicht-weißen Bevölkerungsgruppen haben schlechter bezahlte Jobs und weniger Ressourcen, die sie für die Bildung ihrer Kinder aufwenden können, und viele Familien leben in Lebensmittelwüsten und leiden unter Unterernährung . Rassismus statt Rasse könnte als kausale Variable angesehen werden, die sich auf den Bildungserfolg auswirkt.
Höhepunkte
Das Auftreten einer kausalen Beziehung ist oft auf eine ähnliche Bewegung in einem Diagramm zurückzuführen, die sich als zufällig herausstellt oder durch einen dritten "verwirrenden" Faktor verursacht wird.
Scheinkorrelation oder Scheinkorrelation tritt auf, wenn zwei Faktoren zufällig miteinander verwandt erscheinen, es aber nicht sind.
Die Bestätigung eines kausalen Zusammenhangs erfordert eine Studie, die alle möglichen Variablen kontrolliert.
Statistiker und Wissenschaftler verwenden sorgfältige statistische Analysen, um falsche Beziehungen zu ermitteln.
Falsche Korrelation kann durch kleine Stichprobenumfänge oder willkürliche Endpunkte verursacht werden.
FAQ
Was ist falsche Regression?
Scheinregression ist ein statistisches Modell, das irreführende statistische Beweise für eine lineare Beziehung zeigt; mit anderen Worten, eine Scheinkorrelation zwischen unabhängigen nichtstationären Variablen.
Was ist ein Beispiel für Korrelation, aber nicht für Kausalität?
Ein Beispiel für einen Zusammenhang ist, dass mehr Schlaf tagsüber zu einer besseren Leistungsfähigkeit führt. Obwohl es eine Korrelation gibt, gibt es nicht unbedingt eine Kausalität. Mehr Schlaf ist möglicherweise nicht der Grund, warum eine Person besser abschneidet; Beispielsweise verwenden sie möglicherweise ein neues Softwaretool, das ihre Produktivität steigert. Um eine Kausalität zu finden, muss es sachliche Beweise aus einer Studie geben, die einen kausalen Zusammenhang zwischen Schlaf und Leistung zeigt.
Wie erkennt man falsche Korrelationen?
Statistiker und andere Wissenschaftler, die Daten analysieren, müssen ständig nach falschen Beziehungen Ausschau halten. Es gibt zahlreiche Methoden, die sie verwenden, um sie zu identifizieren, einschließlich: - Gewährleistung einer angemessenen repräsentativen Stichprobe - Erhalt einer angemessenen Stichprobengröße - Vorsicht vor willkürlichen Endpunkten - Kontrolle für so viele externe Variablen wie möglich - Verwendung einer Nullhypothese und Überprüfung auf ein starkes p -Wert
Was ist falsche Kausalität?
Falsche Kausalität bezieht sich auf die Annahme, dass eine Sache aufgrund einer Beziehung zwischen ihnen etwas anderes verursacht. Zum Beispiel können wir annehmen, dass Harry hart trainiert hat, um ein schneller Läufer zu werden, weil sich seine Rennzeiten verbessert haben. Die Realität könnte jedoch sein, dass sich Harrys Rennzeiten verbessert haben, weil er neue Laufschuhe hat, die mit der neuesten Technologie hergestellt wurden. Die ursprüngliche Annahme war eine falsche Kausalität.