Investor's wiki

Multikolinearitet

Multikolinearitet

Hvad er multikolinearitet?

Multikolinearitet er forekomsten af høje interkorrelationer mellem to eller flere uafhængige variable i en multipel regressionsmodel. Multikollinearitet kan føre til skæve eller misvisende resultater, når en forsker eller analytiker forsøger at bestemme, hvor godt hver uafhængig variabel kan bruges mest effektivt til at forudsige eller forstå den afhængige variabel i en statistisk model.

Generelt kan multikolinearitet føre til bredere konfidensintervaller, der producerer mindre pålidelige sandsynligheder med hensyn til effekten af uafhængige variabler i en model.

Forståelse af multikolinearitet

Statistiske analytikere bruger flere regressionsmodeller til at forudsige værdien af en specificeret afhængig variabel baseret på værdierne af to eller flere uafhængige variable. Den afhængige variabel omtales nogle gange som resultat-, mål- eller kriteriumvariablen.

Et eksempel er en multivariat regressionsmodel, der forsøger at forudse aktieafkast baseret på elementer som pris-til-indtjening-forhold (P/E-forhold), markedsværdi, tidligere resultater eller andre data. Aktieafkastet er den afhængige variabel, og de forskellige bits af finansielle data er de uafhængige variable.

Multikollinearitet i en multipel regressionsmodel indikerer, at collineære uafhængige variabler er relaterede på en eller anden måde, selvom forholdet kan være tilfældigt eller ikke. For eksempel kan tidligere resultater være relateret til markedsværdi,. da aktier, der har klaret sig godt tidligere, vil have stigende markedsværdier.

Med andre ord kan multikollinearitet eksistere, når to uafhængige variabler er stærkt korrelerede. Det kan også ske, hvis en uafhængig variabel beregnes ud fra andre variabler i datasættet, eller hvis to uafhængige variabler giver lignende og gentagne resultater.

Særlige overvejelser

En af de mest almindelige måder at eliminere problemet med multikollinearitet på er først at identificere kollineære uafhængige variabler og derefter fjerne alle undtagen én.

Det er også muligt at eliminere multikollinearitet ved at kombinere to eller flere kollineære variable til en enkelt variabel. Statistisk analyse kan derefter udføres for at studere sammenhængen mellem den specificerede afhængige variabel og kun en enkelt uafhængig variabel.

De statistiske slutninger fra en model, der indeholder multikolinearitet, er muligvis ikke pålidelige.

Eksempler på multikolinearitet

I investering

For investering er multikolinearitet en almindelig overvejelse, når der udføres teknisk analyse for at forudsige sandsynlige fremtidige kursbevægelser på et værdipapir, såsom en aktie eller en råvarefuture.

Markedsanalytikere ønsker at undgå at bruge tekniske indikatorer, der er collineære, idet de er baseret på meget lignende eller relaterede input ; de har en tendens til at afsløre lignende forudsigelser vedrørende den afhængige variabel for prisbevægelser. I stedet skal markedsanalysen baseres på markant forskellige uafhængige variabler for at sikre, at de analyserer markedet fra forskellige uafhængige analytiske synsvinkler.

Et eksempel på et potentielt multikolinearitetsproblem er at udføre teknisk analyse kun ved hjælp af flere lignende indikatorer.

Den kendte teknisk analytiker John Bollinger, skaberen af Bollinger Bands- indikatoren, bemærker, at "en kardinalregel for vellykket brug af teknisk analyse kræver, at man undgår multikolinearitet blandt indikatorer." For at løse problemet undgår analytikere at bruge to eller flere tekniske indikatorer af samme type. I stedet analyserer de et værdipapir ved hjælp af en type indikator, såsom en momentumindikator, og laver derefter en separat analyse ved hjælp af en anden type indikator, såsom en trendindikator.

For eksempel er stokastik,. det relative styrkeindeks (RSI) og Williams %R alle momentumindikatorer, der er afhængige af lignende input og sandsynligvis vil producere lignende resultater. I dette tilfælde er det bedre at fjerne alle undtagen én af indikatorerne eller finde en måde at flette flere af dem sammen til kun én indikator, mens du også tilføjer en trendindikator, der sandsynligvis ikke er meget korreleret med momentumindikatoren.

I biologi

Multikolinearitet observeres også i mange andre sammenhænge. En sådan kontekst er menneskelig biologi. For eksempel er et individs blodtryk ikke collineært med alderen, men også vægt, stress og puls.

Højdepunkter

  • Multikollinearitet er et statistisk begreb, hvor flere uafhængige variable i en model er korreleret.

  • Multikollinearitet blandt uafhængige variabler vil resultere i mindre pålidelige statistiske slutninger.

  • Det er bedre at bruge uafhængige variable, der ikke er korrelerede eller gentagne, når man bygger flere regressionsmodeller, der bruger to eller flere variable.

  • To variable anses for at være helt kollineære, hvis deres korrelationskoefficient er +/- 1,0.

  • Eksistensen af multikollinearitet i et datasæt kan føre til mindre pålidelige resultater på grund af større standardfejl.

Ofte stillede spørgsmål

Hvorfor er multikolinearitet et problem?

Multikollinearitet er et problem, fordi det producerer regressionsmodelresultater, der er mindre pålidelige. Dette skyldes bredere konfidensintervaller (større standardfejl ), der kan sænke den statistiske signifikans af regressionskoefficienter.

Hvordan kan man håndtere multikollinearitet?

For at reducere mængden af multikollinearitet, der findes i en model, kan man fjerne de specifikke variabler, der er identificeret som de mest kollineære. Du kan også prøve at kombinere eller transformere de stødende variabler for at sænke deres korrelation. Hvis det ikke virker eller er uopnåeligt, er der modificerede regressionsmodeller, der bedre håndterer multikollinearitet, såsom ridge-regression, principal komponent-regression eller partiel mindste kvadraters regression.

Hvordan opdager du multikolinearitet?

En statistisk teknik kaldet variansinflationsfaktoren (VIF) bruges til at detektere og måle mængden af kollinearitet i en multipel regressionsmodel.

Hvad er perfekt kolinearitet?

Perfekt kollinearitet eksisterer, når der er en nøjagtig 1:1 overensstemmelse mellem to uafhængige variable i en model. Dette kan enten være en korrelation på +1,0 eller -1,0.