Investor's wiki

Falsk korrelasjon

Falsk korrelasjon

Hva er falsk korrelasjon?

I statistikk refererer en falsk korrelasjon (eller falskhet) til en sammenheng mellom to variabler som ser ut til å være årsakssammenheng, men som ikke er det. Med falsk korrelasjon er alle observerte avhengigheter mellom variabler bare på grunn av tilfeldigheter eller er begge relatert til en usett konfounder.

Forstå falsk korrelasjon

Sporiøse sammenhenger vil i utgangspunktet se ut til å vise at en variabel direkte påvirker en annen, men det er ikke tilfelle. Denne misvisende korrelasjonen er ofte forårsaket av en tredje faktor som ikke er tydelig på undersøkelsestidspunktet, noen ganger kalt en forvirrende faktor.

Når to tilfeldige variabler følger hverandre tett på en graf, er det lett å mistenke korrelasjon der en endring i en variabel forårsaker en endring i den andre variabelen. Sett til side årsakssammenheng, som er et annet tema, kan denne observasjonen få leseren av diagrammet til å tro at bevegelsen til variabel A er knyttet til bevegelsen i variabel B eller omvendt.

Imidlertid kan nærmere statistisk undersøkelse vise at de justerte bevegelsene er tilfeldige eller forårsaket av en tredje faktor som påvirker de to variablene. Dette er en falsk sammenheng. Forskning utført med små utvalgsstørrelser eller vilkårlige endepunkter er spesielt utsatt for falskhet.

Å oppdage falskhet

Den mest åpenbare måten å oppdage et falskt forhold i forskningsresultater er å bruke sunn fornuft. Bare fordi to ting oppstår og ser ut til å henge sammen, betyr det ikke at det ikke er andre faktorer som virker. Men for å være sikker, undersøkes forskningsmetoder kritisk.

I studier bør alle variabler som kan påvirke funnene inkluderes i den statistiske modellen for å kontrollere deres innvirkning på den avhengige variabelen.

falsk korrelasjon

Mange falske forhold kan identifiseres ved å bruke sunn fornuft. Hvis en korrelasjon blir funnet, er det vanligvis mer enn én variabel i spill, og variablene er ofte ikke umiddelbart tydelige.

Eksempler på falsk korrelasjon

Interessante sammenhenger er enkle å finne, men mange vil vise seg å være falske. Tre eksempler er teorien om skjørtlengde, superbolleindikatoren og en foreslått korrelasjon mellom fullføringsrater for løp og college.

  1. Teori om skjørtlengde: Med sin opprinnelse på 1920-tallet, hevder teorien om skjørtlengde at skjørtlengder og børsretning er korrelert. Hvis skjørtlengdene er lange, er korrelasjonen at aksjemarkedet er bearish. Hvis skjortelengdene er korte, er markedet bullish.

  2. Super Bowl Indicator: I slutten av januar snakkes det ofte om den såkalte Super Bowl-indikatoren, noe som tyder på at en seier fra American Football Conference-teamet sannsynligvis betyr at børsen vil gå ned i tiden som kommer år, mens en seier av National Football Conference-laget varsler en økning i markedet. Siden begynnelsen av Super Bowl-æraen har indikatoren vært nøyaktig rundt 74 % av tiden, eller 40 av de 54 årene, ifølge OpenMarkets. Det er et morsomt samtalestykke, men sannsynligvis ikke noe en seriøs finansiell rådgiver vil anbefale som en investeringsstrategi for kunder.

  3. Educational Attainment and Race: Samfunnsvitere har fokusert på å identifisere hvilke variabler som påvirker utdanningsoppnåelse. I følge statlig forskning hadde 56 % av hvite 25- til 29-åringer fullført en høyskolegrad i 2019, sammenlignet med bare 36 % av svarte personer på samme alder. Implikasjonen er at rase har en årsakseffekt på fullføringsgraden på college.

Imidlertid er det kanskje ikke rasen i seg selv som påvirker utdanningsnivået. Resultatene kan også skyldes effektene av rasisme i samfunnet, som kan være den tredje «skjulte» variabelen. Rasisme påvirker fargede mennesker, og setter dem dårligere pedagogisk og økonomisk. For eksempel står skolene i ikke-hvite samfunn overfor større utfordringer og får mindre midler, foreldre i ikke-hvite befolkninger har dårligere betalte jobber og færre ressurser å bruke til barnas utdanning, og mange familier lever i matørkener og lider av underernæring. . Rasisme, snarere enn rase, kan sees på som en årsaksvariabel som påvirker utdanningsoppnåelse.

Høydepunkter

  • Utseendet til en årsakssammenheng skyldes ofte lignende bevegelser på et diagram som viser seg å være tilfeldig eller forårsaket av en tredje «forvirrende» faktor.

  • Falsk korrelasjon, eller falskhet, oppstår når to faktorer virker tilfeldig relatert til hverandre, men ikke er det.

– Å bekrefte en årsakssammenheng krever en studie som kontrollerer for alle mulige variabler.

– Statistikere og forskere bruker nøye statistiske analyser for å fastslå falske sammenhenger.

  • Falsk korrelasjon kan være forårsaket av små utvalgsstørrelser eller vilkårlige endepunkter.

FAQ

Hva er falsk regresjon?

Spurious regresjon er en statistisk modell som viser misvisende statistiske bevis på en lineær sammenheng; med andre ord, en falsk korrelasjon mellom uavhengige ikke-stasjonære variabler.

Hva er et eksempel på korrelasjon, men ikke årsakssammenheng?

Et eksempel på en sammenheng er at mer søvn fører til bedre ytelse i løpet av dagen. Selv om det er en sammenheng, er det ikke nødvendigvis årsakssammenheng. Mer søvn er kanskje ikke grunnen til at en person presterer bedre; for eksempel kan de bruke et nytt programvareverktøy som øker produktiviteten deres. For å finne årsakssammenheng må det foreligge faktabevis fra en studie som viser en årsakssammenheng mellom søvn og ytelse.

Hvordan oppdage falsk korrelasjon?

Statistikere og andre forskere som analyserer data må være på utkikk etter falske sammenhenger hele tiden. Det er mange metoder de bruker for å identifisere dem, inkludert: - Sikre et riktig representativt utvalg - Få en tilstrekkelig utvalgsstørrelse - Være på vakt mot vilkårlige endepunkter - Kontrollere for så mange eksterne variabler som mulig - Bruke en nullhypotese og se etter en sterk p -verdi

Hva er falsk årsakssammenheng?

Falsk kausalitet refererer til antakelsen om at én ting forårsaker noe annet på grunn av et forhold mellom dem. For eksempel kan vi anta at Harry har trent hardt for å bli en raskere løper fordi løpstidene hans har blitt bedre. Realiteten kan imidlertid være at Harrys løpstider har forbedret seg fordi han har nye løpesko laget med den nyeste teknologien. Den opprinnelige antagelsen var en falsk årsakssammenheng.