Pozorna korelacja
Co to jest fałszywa korelacja?
W statystyce fałszywa korelacja (lub pozorność) odnosi się do związku między dwiema zmiennymi, który wydaje się być przyczynowy, ale nim nie jest. Przy pozornej korelacji wszelkie zaobserwowane zależności między zmiennymi są jedynie wynikiem przypadku lub są powiązane z jakimś niewidocznym czynnikiem zakłócającym.
Zrozumienie fałszywej korelacji
Fałszywe relacje początkowo wydają się wskazywać, że jedna zmienna ma bezpośredni wpływ na inną, ale tak nie jest. Ta myląca korelacja jest często powodowana przez trzeci czynnik, który nie jest widoczny w czasie badania, czasami nazywany czynnikiem mylącym.
Gdy dwie zmienne losowe śledzą się ściśle na wykresie, łatwo jest podejrzewać korelację, w której zmiana jednej zmiennej powoduje zmianę drugiej zmiennej. Odkładając na bok przyczynowość, co jest kolejnym tematem, obserwacja ta może doprowadzić czytelnika wykresu do przekonania, że ruch zmiennej A jest powiązany z ruchem zmiennej B lub odwrotnie.
Jednak bliższe badanie statystyczne może wykazać, że wyrównane ruchy są przypadkowe lub spowodowane przez trzeci czynnik, który wpływa na te dwie zmienne. To jest fałszywa korelacja. Badania prowadzone na małych próbkach lub arbitralnych punktach końcowych są szczególnie podatne na fałszywość.
Wykrywanie fałszywości
Najbardziej oczywistym sposobem na wykrycie fałszywego związku w wynikach badań jest użycie zdrowego rozsądku. To, że występują dwie rzeczy i wydają się być ze sobą powiązane, nie oznacza, że nie działają żadne inne czynniki. Jednak, aby mieć pewność, metody badawcze są krytycznie badane.
W badaniach wszystkie zmienne, które mogą wpływać na wyniki, powinny być uwzględnione w modelu statystycznym, aby kontrolować ich wpływ na zmienną zależną.
Pozorna korelacja
Wiele fałszywych związków można zidentyfikować, używając zdrowego rozsądku. Jeśli zostanie znaleziona korelacja, zwykle w grę wchodzi więcej niż jedna zmienna, a zmienne często nie są od razu oczywiste.
Przykłady fałszywych korelacji
Ciekawe korelacje są łatwe do znalezienia, ale wiele z nich okaże się fałszywych. Trzy przykłady to teoria długości spódnicy, wskaźnik super misek i sugerowana korelacja między rasą a wskaźnikiem ukończenia college'u.
Teoria długości spódnicy: Pochodząca z lat 20. teoria długości spódnicy zakłada, że długość spódnicy i kierunek na giełdzie są ze sobą skorelowane. Jeśli spódnice są długie, korelacja jest taka, że rynek akcji jest niedźwiedzi. Jeśli koszulki są krótkie, rynek jest uparty.
Wskaźnik Super Bowl: Pod koniec stycznia często mówi się o tak zwanym wskaźniku Super Bowl, który sugeruje, że wygrana zespołu Konferencji Futbolu Amerykańskiego prawdopodobnie oznacza, że giełda spadnie w nadchodzącym rok, natomiast zwycięstwo drużyny Narodowej Konferencji Piłki Nożnej zwiastuje wzrost rynku. Od początku ery Super Bowl wskaźnik był dokładny w około 74% przypadków, czyli 40 z 54 lat, według OpenMarkets. To fajna rozmowa, ale prawdopodobnie nie jest to coś, co poważny doradca finansowy poleciłby jako strategię inwestycyjną dla klientów.
Wykształcenie i rasa: Socjologowie skupili się na określeniu, które zmienne wpływają na osiągnięcia edukacyjne. Według badań rządowych w 2019 r. 56% białych 25-29-latków ukończyło studia wyższe, w porównaniu do zaledwie 36% czarnoskórych osób w tym samym wieku. Wynika z tego, że rasa ma przyczynowy wpływ na wskaźniki ukończenia college'u.
Jednak to nie sama rasa wpływa na poziom wykształcenia. Wyniki mogą być również spowodowane skutkami rasizmu w społeczeństwie, które mogą być trzecią „ukrytą” zmienną. Rasizm dotyka ludzi kolorowych, stawiając ich w niekorzystnej sytuacji edukacyjnej i ekonomicznej. Na przykład szkoły w społecznościach niebiałych stają przed większymi wyzwaniami i otrzymują mniejsze fundusze, rodzice w populacjach innych niż biała mają gorzej płatną pracę i mniej zasobów, które mogą poświęcić na edukację swoich dzieci, a wiele rodzin żyje na pustyniach żywnościowych i cierpi z powodu niedożywienia . Rasizm, a nie rasa, może być postrzegany jako zmienna przyczynowa, która wpływa na osiągnięcia edukacyjne.
Przegląd najważniejszych wydarzeń
Pojawienie się związku przyczynowego jest często spowodowane podobnym ruchem na wykresie, który okazuje się być przypadkowy lub spowodowany przez trzeci „mylący” czynnik.
Pozorna korelacja lub pozorność ma miejsce, gdy dwa czynniki wydają się być przypadkowo powiązane ze sobą, ale nie są.
Potwierdzenie związku przyczynowego wymaga badania kontrolującego wszystkie możliwe zmienne.
Statystycy i naukowcy stosują staranną analizę statystyczną w celu ustalenia fałszywych zależności.
Pozorna korelacja może być spowodowana małymi rozmiarami próbek lub arbitralnymi punktami końcowymi.
FAQ
Co to jest fałszywa regresja?
Regresja pozorna to model statystyczny, który pokazuje mylące dowody statystyczne na zależność liniową; innymi słowy, fałszywa korelacja między niezależnymi zmiennymi niestacjonarnymi.
Jaki jest przykład korelacji, ale nie przyczynowość?
Przykładem korelacji jest to, że więcej snu prowadzi do lepszej wydajności w ciągu dnia. Chociaż istnieje korelacja, niekoniecznie musi istnieć związek przyczynowy. Więcej snu może nie być powodem, dla którego dana osoba działa lepiej; na przykład mogą używać nowego narzędzia programowego, które zwiększa ich produktywność. Aby znaleźć związek przyczynowy, muszą istnieć dowody rzeczowe z badania, które pokazuje związek przyczynowy między snem a wydajnością.
Jak rozpoznać fałszywą korelację?
Statystycy i inni naukowcy, którzy analizują dane, muszą cały czas szukać fałszywych powiązań. Istnieje wiele metod, których używają do ich identyfikacji, w tym: - Zapewnienie właściwej próby reprezentatywnej - Uzyskanie odpowiedniej wielkości próby - Ostrożność wobec arbitralnych punktów końcowych - Kontrolowanie jak największej liczby zmiennych zewnętrznych - Stosowanie hipotezy zerowej i sprawdzanie silnego p -wartość
Co to jest fałszywa przyczynowość?
Fałszywa przyczynowość odnosi się do założenia, że jedna rzecz powoduje coś innego ze względu na związek między nimi. Na przykład możemy założyć, że Harry ciężko trenował, aby stać się szybszym biegaczem, ponieważ poprawiły się jego czasy wyścigów. Jednak rzeczywistość może być taka, że czasy wyścigów Harry'ego uległy poprawie, ponieważ ma nowe buty do biegania wykonane przy użyciu najnowszych technologii. Wstępne założenie było fałszywą przyczynowością.