Investor's wiki

Variansinflationsfaktor (VIF)

Variansinflationsfaktor (VIF)

Hvad er en variansinflationsfaktor (VIF)?

Variansinflationsfaktor (VIF) er et mål for mængden af multikollinearitet i et sæt af multiple regressionsvariable. Matematisk er VIF for en regressionsmodelvariabel lig med forholdet mellem den overordnede modelvariation og variansen af en model, der kun inkluderer den enkelte uafhængige variabel. Dette forhold beregnes for hver uafhængig variabel. En høj VIF indikerer, at den tilknyttede uafhængige variabel er meget kolineær med de andre variable i modellen.

Forståelse af en variansinflationsfaktor (VIF)

En variansinflationsfaktor er et værktøj til at hjælpe med at identificere graden af multikollinearitet. En multipel regression bruges, når en person ønsker at teste effekten af flere variabler på et bestemt resultat. Den afhængige variabel er det resultat, der bliver påvirket af de uafhængige variable - input i modellen. Multikolinearitet eksisterer, når der er en lineær sammenhæng, eller korrelation, mellem en eller flere af de uafhængige variabler eller input.

Multikollinearitet skaber et problem i den multiple regression, fordi inputs alle påvirker hinanden. Derfor er de faktisk ikke uafhængige, og det er svært at teste, hvor meget kombinationen af de uafhængige variable påvirker den afhængige variabel, eller udfaldet, indenfor regressionsmodellen.

Statistisk set vil en multipel regressionsmodel, hvor der er høj multikollinearitet, gøre det sværere at estimere sammenhængen mellem hver af de uafhængige variable og den afhængige variabel. Små ændringer i de anvendte data eller i strukturen af modelligningen kan give store og uregelmæssige ændringer i de estimerede koefficienter på de uafhængige variable.

For at sikre, at modellen er korrekt specificeret og fungerer korrekt, er der test, der kan køres for multikolinearitet. Variansinflationsfaktor er et sådant måleværktøj. Brug af variansinflationsfaktorer hjælper med at identificere alvoren af eventuelle multikolinearitetsproblemer, så modellen kan justeres. Variansinflationsfaktor måler, hvor meget adfærden (variansen) af en uafhængig variabel er påvirket, eller oppustet, af dens interaktion/korrelation med de andre uafhængige variable.

Variansinflationsfaktorer tillader et hurtigt mål for, hvor meget en variabel bidrager til standardfejlen i regressionen. Når der eksisterer betydelige multikolinearitetsproblemer, vil variansinflationsfaktoren være meget stor for de involverede variable. Efter at disse variable er identificeret, kan flere tilgange bruges til at eliminere eller kombinere kollineære variabler, hvilket løser multikollinearitetsproblemet.

Multikolinearitet

Mens multikollinearitet ikke reducerer en models samlede forudsigelsesevne, kan den producere estimater af regressionskoefficienter, der ikke er statistisk signifikante. I en vis forstand kan det opfattes som en slags dobbelttælling i modellen.

Når to eller flere uafhængige variabler er tæt beslægtede eller måler næsten det samme, så bliver den underliggende effekt, som de måler, taget højde for to gange (eller mere) på tværs af variablerne. Det bliver svært eller umuligt at sige, hvilken variabel der virkelig påvirker den uafhængige variabel. Dette er et problem, fordi målet med mange økonometriske modeller er at teste præcis denne form for statistisk sammenhæng mellem de uafhængige variable og den afhængige variabel.

Antag for eksempel, at en økonom ønsker at teste, om der er en statistisk signifikant sammenhæng mellem arbejdsløshedsraten (uafhængig variabel) og inflationsraten (afhængig variabel). At inkludere yderligere uafhængige variabler, der er relateret til arbejdsløshedsprocenten,. vil sandsynligvis indføre multikolinearitet i modellen .

Den overordnede model kan vise en stærk, statistisk tilstrækkelig forklaringskraft, men være ude af stand til at identificere, om effekten hovedsageligt skyldes arbejdsløshedsprocenten eller de nye indledende arbejdsløshedsansøgninger. Dette er, hvad VIF'en ville opdage, og det ville foreslå muligvis at droppe en af variablerne ud af modellen eller finde en måde at konsolidere dem på for at fange deres fælles effekt afhængigt af, hvilken specifik hypotese forskeren er interesseret i at teste.

Højdepunkter

  • En variansinflationsfaktor (VIF) giver et mål for multikollinearitet blandt de uafhængige variable i en multipel regressionsmodel.

  • Det er vigtigt at påvise multikollinearitet, fordi selvom multikollinearitet ikke reducerer modellens forklaringskraft, så reducerer den den statistiske signifikans af de uafhængige variable.

  • En stor varians inflationsfaktor (VIF) på en uafhængig variabel indikerer et meget kollineært forhold til de andre variable, der bør tages i betragtning eller justeres for i modellens struktur og udvælgelse af uafhængige variable.