Varianz-Inflationsfaktor (VIF)
Was ist ein Varianzinflationsfaktor (VIF)?
Der Varianzinflationsfaktor (VIF) ist ein MaĂ fĂŒr das AusmaĂ der MultikollinearitĂ€t in einem Satz multipler Regressionsvariablen. Mathematisch gesehen ist der VIF fĂŒr eine Regressionsmodellvariable gleich dem VerhĂ€ltnis der Gesamtmodellvarianz zur Varianz eines Modells, das nur diese einzelne unabhĂ€ngige Variable enthĂ€lt. Dieses VerhĂ€ltnis wird fĂŒr jede unabhĂ€ngige Variable berechnet. Ein hoher VIF weist darauf hin, dass die zugehörige unabhĂ€ngige Variable stark kollinear mit den anderen Variablen im Modell ist.
Einen Varianzinflationsfaktor (VIF) verstehen
Ein Varianzinflationsfaktor ist ein Hilfsmittel, um den Grad der MultikollinearitĂ€t zu identifizieren. Eine multiple Regression wird verwendet, wenn eine Person die Wirkung mehrerer Variablen auf ein bestimmtes Ergebnis testen möchte. Die abhĂ€ngige Variable ist das Ergebnis, auf das die unabhĂ€ngigen Variablen reagieren â die Eingaben in das Modell. MultikollinearitĂ€t liegt vor, wenn eine lineare Beziehung oder Korrelation zwischen einer oder mehreren der unabhĂ€ngigen Variablen oder Eingaben besteht.
MultikollinearitÀt verursacht ein Problem bei der multiplen Regression, da sich alle Eingaben gegenseitig beeinflussen. Daher sind sie nicht wirklich unabhÀngig, und es ist schwierig zu testen, wie stark die Kombination der unabhÀngigen Variablen die abhÀngige Variable oder das Ergebnis innerhalb des Regressionsmodells beeinflusst.
Statistisch gesehen wird es durch ein multiples Regressionsmodell mit hoher MultikollinearitĂ€t schwieriger, die Beziehung zwischen jeder der unabhĂ€ngigen Variablen und der abhĂ€ngigen Variablen abzuschĂ€tzen. Kleine Ănderungen in den verwendeten Daten oder in der Struktur der Modellgleichung können groĂe und unberechenbare Ănderungen in den geschĂ€tzten Koeffizienten der unabhĂ€ngigen Variablen erzeugen.
Um sicherzustellen, dass das Modell richtig spezifiziert ist und richtig funktioniert, gibt es Tests, die auf MultikollinearitĂ€t ausgefĂŒhrt werden können. Der Varianzinflationsfaktor ist ein solches Messinstrument. Die Verwendung von Varianzinflationsfaktoren hilft, den Schweregrad von MultikollinearitĂ€tsproblemen zu identifizieren, sodass das Modell angepasst werden kann. Der Varianzinflationsfaktor misst, wie stark das Verhalten (Varianz) einer unabhĂ€ngigen Variablen durch ihre Wechselwirkung/Korrelation mit den anderen unabhĂ€ngigen Variablen beeinflusst oder aufgeblĂ€ht wird.
Varianz-Inflationsfaktoren ermöglichen ein schnelles MaĂ dafĂŒr, wie viel eine Variable zum Standardfehler in der Regression beitrĂ€gt . Wenn erhebliche MultikollinearitĂ€tsprobleme bestehen, wird der Varianzinflationsfaktor fĂŒr die beteiligten Variablen sehr groĂ sein. Nachdem diese Variablen identifiziert wurden, können mehrere AnsĂ€tze verwendet werden, um kollineare Variablen zu eliminieren oder zu kombinieren und so das Problem der MultikollinearitĂ€t zu lösen.
MultikollinearitÀt
WÀhrend MultikollinearitÀt die Gesamtvorhersagekraft eines Modells nicht verringert, kann sie SchÀtzungen der Regressionskoeffizienten erzeugen, die statistisch nicht signifikant sind. In gewisser Weise kann man sich das als eine Art DoppelzÀhlung im Modell vorstellen.
Wenn zwei oder mehr unabhĂ€ngige Variablen eng miteinander verbunden sind oder fast dasselbe messen, wird der zugrunde liegende Effekt, den sie messen, doppelt (oder mehr) ĂŒber die Variablen hinweg berĂŒcksichtigt. Es wird schwierig oder unmöglich zu sagen, welche Variable die unabhĂ€ngige Variable wirklich beeinflusst. Dies ist ein Problem, da das Ziel vieler ökonometrischer Modelle darin besteht, genau diese Art von statistischer Beziehung zwischen den unabhĂ€ngigen Variablen und der abhĂ€ngigen Variablen zu testen.
Angenommen, ein Wirtschaftswissenschaftler möchte testen, ob es einen statistisch signifikanten Zusammenhang zwischen der Arbeitslosenquote (unabhĂ€ngige Variable) und der Inflationsrate (abhĂ€ngige Variable) gibt. Die Einbeziehung zusĂ€tzlicher unabhĂ€ngiger Variablen, die sich auf die Arbeitslosenquote beziehen,. wie z. B. neue ErstantrĂ€ge auf ArbeitslosenunterstĂŒtzung,. wĂŒrde wahrscheinlich MultikollinearitĂ€t in das Modell einfĂŒhren.
Das Gesamtmodell weist möglicherweise eine starke, statistisch ausreichende ErklĂ€rungskraft auf, kann jedoch nicht erkennen, ob der Effekt hauptsĂ€chlich auf die Arbeitslosenquote oder auf die neuen ErstantrĂ€ge auf ArbeitslosenunterstĂŒtzung zurĂŒckzufĂŒhren ist. Dies wĂŒrde der VIF erkennen und vorschlagen, möglicherweise eine der Variablen aus dem Modell zu streichen oder einen Weg zu finden, sie zu konsolidieren, um ihre gemeinsame Wirkung zu erfassen, je nachdem, welche spezifische Hypothese der Forscher testen möchte.
Höhepunkte
Ein Varianzinflationsfaktor (VIF) liefert ein MaĂ fĂŒr die MultikollinearitĂ€t zwischen den unabhĂ€ngigen Variablen in einem multiplen Regressionsmodell.
Das Erkennen von MultikollinearitÀt ist wichtig, da MultikollinearitÀt zwar nicht die ErklÀrungskraft des Modells verringert, jedoch die statistische Signifikanz der unabhÀngigen Variablen verringert.
Ein Inflationsfaktor mit groĂer Varianz (VIF) bei einer unabhĂ€ngigen Variablen weist auf eine stark kollineare Beziehung zu den anderen Variablen hin, die bei der Struktur des Modells und der Auswahl unabhĂ€ngiger Variablen berĂŒcksichtigt oder angepasst werden sollten.