Variansinflasjonsfaktor (VIF)
Hva er en variansinflasjonsfaktor (VIF)?
Variansinflasjonsfaktor (VIF) er et mål på mengden multikollinearitet i et sett med flere regresjonsvariabler. Matematisk er VIF for en regresjonsmodellvariabel lik forholdet mellom den totale modellvariansen og variansen til en modell som bare inkluderer den enkelte uavhengige variabelen. Dette forholdet beregnes for hver uavhengig variabel. En høy VIF indikerer at den assosierte uavhengige variabelen er høyst kolineær med de andre variablene i modellen.
Forstå en variansinflasjonsfaktor (VIF)
En variansinflasjonsfaktor er et verktøy for å identifisere graden av multikollinearitet. En multippel regresjon brukes når en person ønsker å teste effekten av flere variabler på et bestemt utfall. Den avhengige variabelen er resultatet som blir påvirket av de uavhengige variablene - inputene til modellen. Multikollinearitet eksisterer når det er en lineær sammenheng, eller korrelasjon, mellom en eller flere av de uavhengige variablene eller inngangene.
Multikollinearitet skaper et problem i multippel regresjon fordi alle inputene påvirker hverandre. Derfor er de faktisk ikke uavhengige, og det er vanskelig å teste hvor mye kombinasjonen av de uavhengige variablene påvirker den avhengige variabelen, eller utfallet, innenfor regresjonsmodellen.
Statistisk sett vil en multippel regresjonsmodell hvor det er høy multikollinearitet gjøre det vanskeligere å estimere sammenhengen mellom hver av de uavhengige variablene og den avhengige variabelen. Små endringer i dataene som brukes eller i strukturen til modellligningen kan gi store og uberegnelige endringer i de estimerte koeffisientene på de uavhengige variablene.
For å sikre at modellen er riktig spesifisert og fungerer korrekt, finnes det tester som kan kjøres for multikollinearitet. Variansinflasjonsfaktor er et slikt måleverktøy. Å bruke variansinflasjonsfaktorer hjelper til med å identifisere alvorlighetsgraden av eventuelle multikollinearitetsproblemer slik at modellen kan justeres. Variansinflasjonsfaktor måler hvor mye atferden (variansen) til en uavhengig variabel er påvirket, eller oppblåst, av dens interaksjon/korrelasjon med de andre uavhengige variablene.
Variansinflasjonsfaktorer tillater et raskt mål på hvor mye en variabel bidrar til standardfeilen i regresjonen. Når det eksisterer betydelige multikollinearitetsproblemer, vil variansinflasjonsfaktoren være svært stor for de involverte variablene. Etter at disse variablene er identifisert, kan flere tilnærminger brukes til å eliminere eller kombinere kollineære variabler, og løse multikollinearitetsproblemet.
Multikollinearitet
Mens multikollinearitet ikke reduserer en modells samlede prediksjonskraft, kan den produsere estimater av regresjonskoeffisientene som ikke er statistisk signifikante. På en måte kan det tenkes på som en slags dobbelttelling i modellen.
Når to eller flere uavhengige variabler er nært beslektet eller måler nesten det samme, blir den underliggende effekten de måler tatt med to ganger (eller mer) på tvers av variablene. Det blir vanskelig eller umulig å si hvilken variabel som virkelig påvirker den uavhengige variabelen. Dette er et problem fordi målet med mange økonometriske modeller er å teste akkurat denne typen statistiske forhold mellom de uavhengige variablene og den avhengige variabelen.
Anta for eksempel at en økonom ønsker å teste om det er en statistisk signifikant sammenheng mellom arbeidsledighetsraten (uavhengig variabel) og inflasjonsraten (avhengig variabel). Inkludering av flere uavhengige variabler som er relatert til arbeidsledighetsraten,. vil sannsynligvis introdusere multikollinearitet i modellen .
Den overordnede modellen kan vise sterk, statistisk tilstrekkelig forklaringskraft, men være ute av stand til å identifisere om effekten hovedsakelig skyldes arbeidsledighetsraten eller de nye innledende arbeidsløshetskravene. Dette er hva VIF vil oppdage, og det vil foreslå muligens å slippe en av variablene ut av modellen eller finne en måte å konsolidere dem for å fange deres felles effekt avhengig av hvilken spesifikk hypotese forskeren er interessert i å teste.
Høydepunkter
- En variansinflasjonsfaktor (VIF) gir et mål på multikollinearitet blant de uavhengige variablene i en multippel regresjonsmodell.
– Å oppdage multikollinearitet er viktig fordi mens multikollinearitet ikke reduserer forklaringskraften til modellen, reduserer den den statistiske signifikansen til de uavhengige variablene.
- En stor varians inflasjonsfaktor (VIF) på en uavhengig variabel indikerer et sterkt kollineært forhold til de andre variablene som bør vurderes eller justeres for i strukturen til modellen og valg av uavhengige variabler.