Investor's wiki

Falsk sammenhæng

Falsk sammenhæng

Hvad er falsk korrelation?

I statistikker refererer en falsk korrelation (eller falskhed) til en forbindelse mellem to variable, der ser ud til at være kausale, men ikke er det. Med falsk korrelation er enhver observeret afhængighed mellem variabler blot på grund af tilfældigheder eller er begge relateret til en eller anden uset konfounder.

Forståelse af falsk sammenhæng

Forfalskede sammenhænge vil i begyndelsen synes at vise, at en variabel direkte påvirker en anden, men det er ikke tilfældet. Denne vildledende sammenhæng er ofte forårsaget af en tredje faktor, der ikke er synlig på undersøgelsestidspunktet, nogle gange kaldet en forvirrende faktor.

Når to tilfældige variable følger hinanden tæt på en graf, er det let at mistænke korrelation, hvor en ændring i en variabel forårsager en ændring i den anden variabel. Hvis man ser bort fra årsagssammenhæng, som er et andet emne, kan denne observation få læseren af diagrammet til at tro, at bevægelsen af variabel A er forbundet med bevægelsen i variabel B eller omvendt.

En nærmere statistisk undersøgelse kan dog vise, at de afstemte bevægelser er tilfældige eller forårsaget af en tredje faktor, der påvirker de to variable. Dette er en falsk sammenhæng. Forskning udført med små stikprøvestørrelser eller vilkårlige endepunkter er særligt modtagelige for falskhed.

Spotting af falskhed

Den mest oplagte måde at få øje på et falsk forhold i forskningsresultater er at bruge sund fornuft. Bare fordi to ting opstår og ser ud til at være forbundet, betyder det ikke, at der ikke er andre faktorer, der virker. Men for at være sikker, undersøges forskningsmetoder kritisk.

I undersøgelser bør alle variabler, der kan påvirke resultaterne, inkluderes i den statistiske model for at kontrollere deres indvirkning på den afhængige variabel.

falsk sammenhæng

Mange falske forhold kan identificeres ved at bruge sund fornuft. Hvis der findes en sammenhæng, er der normalt mere end én variabel i spil, og variablerne er ofte ikke umiddelbart tydelige.

Eksempler på falsk korrelation

Interessante sammenhænge er lette at finde, men mange vil vise sig at være falske. Tre eksempler er teorien om skørtelængde, super bowl-indikatoren og en foreslået sammenhæng mellem race og college-gennemførelsesrater.

  1. Skirt Length Theory: Med oprindelse i 1920'erne hævder teorien om skørtelængde, at skørtelængder og børsretning er korreleret. Hvis nederdelængderne er lange, er sammenhængen, at aktiemarkedet er bearish. Hvis skjortelængderne er korte, er markedet bullish.

  2. Super Bowl Indicator: I slutningen af januar bliver der ofte snakket om den såkaldte Super Bowl-indikator, hvilket tyder på, at en sejr fra American Football Conference-hold sandsynligvis betyder, at aktiemarkedet vil falde i den kommende tid. år, hvorimod en sejr fra National Football Conference-holdet varsler en stigning i markedet. Siden begyndelsen af Super Bowl-æraen har indikatoren været nøjagtig omkring 74% af tiden, eller 40 ud af de 54 år, ifølge OpenMarkets. Det er et sjovt samtalestykke, men sandsynligvis ikke noget, en seriøs finansiel rådgiver vil anbefale som en investeringsstrategi for kunder.

  3. Uddannelsesniveau og race: Samfundsforskere har fokuseret på at identificere, hvilke variabler der påvirker uddannelsesniveauet. Ifølge regeringsundersøgelser havde 56 % af hvide 25- til 29-årige afsluttet en universitetsuddannelse i 2019 sammenlignet med kun 36 % af sorte personer i samme alder. Implikationen er, at race har en kausal effekt på universitetsgennemførelsesraterne.

Men det er måske ikke racen i sig selv, der påvirker uddannelsesniveauet. Resultaterne kan også skyldes virkningerne af racisme i samfundet, som kunne være den tredje "skjulte" variabel. Racisme påvirker farvede mennesker og stiller dem dårligere uddannelsesmæssigt og økonomisk. For eksempel står skolerne i ikke-hvide samfund over for større udfordringer og modtager færre midler, forældre i ikke-hvide befolkninger har lavere betalte job og færre ressourcer til at afsætte til deres børns uddannelse, og mange familier lever i madørkener og lider af underernæring. . Racisme, snarere end race, kan ses som en årsagsvariabel, der påvirker uddannelsesniveauet.

##Højdepunkter

  • Fremkomsten af en årsagssammenhæng skyldes ofte en lignende bevægelse på et diagram, der viser sig at være tilfældig eller forårsaget af en tredje "forvirrende" faktor.

  • Falsk korrelation, eller falskhed, opstår, når to faktorer forekommer tilfældigt relateret til hinanden, men ikke er det.

  • At bekræfte en årsagssammenhæng kræver en undersøgelse, der kontrollerer for alle mulige variable.

  • Statistikere og videnskabsmænd bruger omhyggelig statistisk analyse til at bestemme falske sammenhænge.

  • Falsk korrelation kan være forårsaget af små stikprøvestørrelser eller vilkårlige endepunkter.

##Ofte stillede spørgsmål

Hvad er falsk regression?

Spurious regression er en statistisk model, der viser vildledende statistiske beviser for en lineær sammenhæng; med andre ord en falsk korrelation mellem uafhængige ikke-stationære variable.

Hvad er et eksempel på sammenhæng, men ikke årsagssammenhæng?

Et eksempel på en sammenhæng er, at mere søvn fører til bedre præstationer i løbet af dagen. Selvom der er en sammenhæng, er der ikke nødvendigvis en årsagssammenhæng. Mere søvn er muligvis ikke grunden til, at en person klarer sig bedre; for eksempel kan de bruge et nyt softwareværktøj, der øger deres produktivitet. For at finde årsagssammenhæng skal der være faktuelle beviser fra en undersøgelse, der viser en årsagssammenhæng mellem søvn og præstation.

Hvordan finder man falsk sammenhæng?

Statistikere og andre videnskabsmænd, der analyserer data, skal hele tiden være på udkig efter falske forhold. Der er adskillige metoder, som de bruger til at identificere dem, herunder: - Sikring af en ordentlig repræsentativ stikprøve - Opnåelse af en passende stikprøvestørrelse - Vær på vagt over for vilkårlige endepunkter - Kontrol for så mange eksterne variabler som muligt - Brug af en nulhypotese og kontrol af et stærkt p -værdi

Hvad er falsk kausalitet?

Falsk kausalitet refererer til antagelsen om, at én ting forårsager noget andet på grund af et forhold mellem dem. For eksempel kan vi antage, at Harry har trænet hårdt for at blive en hurtigere løber, fordi hans løbstider er blevet bedre. Virkeligheden kan dog være, at Harrys løbstider er blevet bedre, fordi han har lavet nye løbesko med den nyeste teknologi. Den oprindelige antagelse var en falsk kausalitet.