Multikollinearitet

Hva er multikollinearitet?

Multikollinearitet er forekomsten av høye interkorrelasjoner mellom to eller flere uavhengige variabler i en multippel regresjonsmodell. Multikollinearitet kan føre til skjeve eller misvisende resultater når en forsker eller analytiker prøver å bestemme hvor godt hver uavhengig variabel kan brukes mest effektivt for å forutsi eller forstå den avhengige variabelen i en statistisk modell.

Generelt kan multikollinearitet føre til bredere konfidensintervaller som gir mindre pålitelige sannsynligheter når det gjelder effekten av uavhengige variabler i en modell.

Forstå multikollinearitet

Statistiske analytikere bruker flere regresjonsmodeller for å forutsi verdien av en spesifisert avhengig variabel basert på verdiene til to eller flere uavhengige variabler. Den avhengige variabelen blir noen ganger referert til som utfalls-, mål- eller kriterievariabelen.

Et eksempel er en multivariat regresjonsmodell som forsøker å forutse aksjeavkastning basert på elementer som pris-til-inntjening-forhold (P/E-forhold), markedsverdi, tidligere resultater eller andre data. Aksjeavkastningen er den avhengige variabelen, og de ulike delene av finansielle data er de uavhengige variablene.

Multikollinearitet i en multippel regresjonsmodell indikerer at kollineære uavhengige variabler er relatert på en eller annen måte, selv om forholdet kan være tilfeldig eller ikke. Tidligere resultater kan for eksempel være relatert til markedsverdi,. ettersom aksjer som har prestert godt tidligere vil ha økende markedsverdier.

Med andre ord, multikollinearitet kan eksistere når to uavhengige variabler er sterkt korrelerte. Det kan også skje hvis en uavhengig variabel beregnes fra andre variabler i datasettet eller hvis to uavhengige variabler gir lignende og repeterende resultater.

Spesielle hensyn

En av de vanligste måtene å eliminere problemet med multikollinearitet er å først identifisere kollineære uavhengige variabler og deretter fjerne alle unntatt én.

Det er også mulig å eliminere multikollinearitet ved å kombinere to eller flere kollineære variabler til en enkelt variabel. Statistisk analyse kan deretter utføres for å studere forholdet mellom den spesifiserte avhengige variabelen og bare en enkelt uavhengig variabel.

De statistiske slutningene fra en modell som inneholder multikollinearitet er kanskje ikke pålitelige.

Eksempler på multikollinearitet

###Innvestering

For investering er multikollinearitet en vanlig vurdering når man utfører teknisk analyse for å forutsi sannsynlige fremtidige prisbevegelser for et verdipapir, for eksempel en aksje eller en råvarefuture.

Markedsanalytikere ønsker å unngå å bruke tekniske indikatorer som er kollineære ved at de er basert på svært like eller relaterte input; de har en tendens til å avsløre lignende spådommer angående den avhengige variabelen for prisbevegelse. I stedet må markedsanalysen baseres på markant forskjellige uavhengige variabler for å sikre at de analyserer markedet fra ulike uavhengige analytiske synsvinkler.

Et eksempel på et potensielt multikollinearitetsproblem er å utføre teknisk analyse kun ved å bruke flere lignende indikatorer.

Den kjente teknisk analytiker John Bollinger, skaperen av Bollinger Bands - indikatoren, bemerker at "en kardinalregel for vellykket bruk av teknisk analyse krever å unngå multikollinearitet blant indikatorer." For å løse problemet unngår analytikere å bruke to eller flere tekniske indikatorer av samme type. I stedet analyserer de et verdipapir ved å bruke én type indikator, for eksempel en momentumindikator, og gjør deretter en separat analyse ved å bruke en annen type indikator, for eksempel en trendindikator.

For eksempel er stokastikk,. den relative styrkeindeksen (RSI) og Williams %R alle momentumindikatorer som er avhengige av lignende input og som sannsynligvis vil gi lignende resultater. I dette tilfellet er det bedre å fjerne alle unntatt én av indikatorene eller finne en måte å slå sammen flere av dem til bare én indikator, samtidig som du legger til en trendindikator som sannsynligvis ikke er sterkt korrelert med momentumindikatoren.

###I biologi

Multikollinearitet observeres også i mange andre sammenhenger. En slik kontekst er menneskelig biologi. For eksempel er et individs blodtrykk ikke kollineært med alderen, men også vekt, stress og puls.

##Høydepunkter

– Multikollinearitet er et statistisk begrep hvor flere uavhengige variabler i en modell er korrelert.

– Multikollinearitet blant uavhengige variabler vil resultere i mindre pålitelige statistiske slutninger.

– Det er bedre å bruke uavhengige variabler som ikke er korrelerte eller repeterende når man bygger flere regresjonsmodeller som bruker to eller flere variabler.

To variabler anses å være perfekt kollineære hvis deres korrelasjonskoeffisient er +/- 1,0.

– Eksistensen av multikollinearitet i et datasett kan føre til mindre pålitelige resultater på grunn av større standardfeil.

##FAQ

Hvorfor er multikollinearitet et problem?

Multikollinearitet er et problem fordi det produserer regresjonsmodellresultater som er mindre pålitelige. Dette skyldes bredere konfidensintervall (større standardfeil ) som kan senke den statistiske signifikansen til regresjonskoeffisienter.

Hvordan kan man håndtere multikollinearitet?

For å redusere mengden multikollinearitet som finnes i en modell, kan man fjerne de spesifikke variablene som er identifisert som de mest kollineære. Du kan også prøve å kombinere eller transformere de støtende variablene for å redusere korrelasjonen deres. Hvis det ikke fungerer eller er uoppnåelig, finnes det modifiserte regresjonsmodeller som bedre håndterer multikollinearitet, for eksempel ryggregresjon, hovedkomponentregresjon eller delvis minste kvadraters regresjon.

Hvordan oppdager du multikollinearitet?

En statistisk teknikk kalt variansinflasjonsfaktoren (VIF) brukes til å oppdage og måle mengden kollinearitet i en multippel regresjonsmodell.

Hva er perfekt kolinearitet?

Perfekt kollinearitet eksisterer når det er en nøyaktig 1:1 korrespondanse mellom to uavhengige variabler i en modell. Dette kan enten være en korrelasjon på +1,0 eller -1,0.