Varianssiinflaatiokerroin (VIF)
Mikä on varianssiinflaatiotekijä (VIF)?
Varianssiinflaatiokerroin (VIF) on monikollineaarisuuden mitta useiden regressiomuuttujien joukossa. Matemaattisesti regressiomallimuuttujan VIF on yhtä suuri kuin mallin kokonaisvarianssin suhde sellaisen mallin varianssiin,. joka sisältää vain kyseisen yksittäisen riippumattoman muuttujan. Tämä suhde lasketaan kullekin riippumattomalle muuttujalle. Korkea VIF osoittaa, että siihen liittyvä riippumaton muuttuja on erittäin kollineaarinen mallin muiden muuttujien kanssa.
Varianssiinflaatiotekijän (VIF) ymmärtäminen
Varianssiinflaatiokerroin on työkalu, joka auttaa tunnistamaan multikollineaarisuuden asteen. Moninkertaista regressiota käytetään, kun henkilö haluaa testata useiden muuttujien vaikutusta tiettyyn tulokseen. Riippuva muuttuja on tulos, johon riippumattomat muuttujat vaikuttavat - mallin syötteet. Multikollineaarisuus on olemassa, kun yhden tai useamman riippumattoman muuttujan tai syötteen välillä on lineaarinen suhde tai korrelaatio.
Multikollineaarisuus luo ongelman moninkertaisessa regressiossa, koska kaikki syötteet vaikuttavat toisiinsa. Siksi ne eivät itse asiassa ole riippumattomia, ja on vaikea testata, kuinka paljon riippumattomien muuttujien yhdistelmä vaikuttaa riippuvaiseen muuttujaan tai tulokseen regressiomallissa.
Tilastollisesti sanottuna moninkertainen regressiomalli, jossa on korkea multikollineaarisuus, tekee vaikeammaksi arvioida kunkin riippumattoman muuttujan ja riippuvan muuttujan välistä suhdetta. Pienet muutokset käytetyssä tiedossa tai malliyhtälön rakenteessa voivat aiheuttaa suuria ja satunnaisia muutoksia riippumattomien muuttujien estimoituihin kertoimiin.
Sen varmistamiseksi, että malli on määritetty oikein ja toimii oikein, on olemassa testejä, jotka voidaan suorittaa monikollineaarisuuden varalta. Varianssiinflaatiokerroin on yksi tällainen mittausväline. Varianssiinflaatiokertoimien käyttö auttaa tunnistamaan mahdollisten multikollineaarisuusongelmien vakavuuden, jotta mallia voidaan säätää. Varianssiinflaatiokerroin mittaa, kuinka paljon riippumattoman muuttujan käyttäytymiseen (varianssiin) vaikuttaa tai kasvaa sen vuorovaikutus/korrelaatio muiden riippumattomien muuttujien kanssa.
Varianssiinflaatiokertoimet mahdollistavat nopean mittauksen siitä, kuinka paljon muuttuja vaikuttaa regression standardivirheeseen. Kun merkittäviä multikollineaarisuusongelmia esiintyy, varianssiinflaatiokerroin on erittäin suuri kyseessä oleville muuttujille. Kun nämä muuttujat on tunnistettu, voidaan käyttää useita lähestymistapoja kollineaaristen muuttujien eliminoimiseen tai yhdistämiseen, mikä ratkaisee multikollineaarisuusongelman.
Monikollineaarisuus
Vaikka multikollineaarisuus ei vähennä mallin yleistä ennustevoimaa, se voi tuottaa regressiokertoimien arvioita, jotka eivät ole tilastollisesti merkittäviä. Tietyssä mielessä sitä voidaan pitää eräänlaisena kaksoislaskentana mallissa.
Kun kaksi tai useampi riippumaton muuttuja liittyvät läheisesti toisiinsa tai mittaavat melkein samaa asiaa, niiden mittaama taustavaikutus huomioidaan kahdesti (tai useammin) muuttujien välillä. On vaikeaa tai mahdotonta sanoa, mikä muuttuja todella vaikuttaa riippumattomaan muuttujaan. Tämä on ongelma, koska monien ekonometristen mallien tavoitteena on testata juuri tällaista tilastollista suhdetta riippumattomien muuttujien ja riippuvaisen muuttujan välillä.
Oletetaan esimerkiksi, että taloustieteilijä haluaa testata, onko työttömyysasteen (riippumaton muuttuja) ja inflaatioasteen (riippuvainen muuttuja) välillä tilastollisesti merkitsevä suhde. Lisätyöttömyysasteeseen liittyvien riippumattomien muuttujien sisällyttäminen , kuten uusi ensimmäinen työttömyyshakemus,. toisi todennäköisesti malliin multikollineaarisuuden .
Kokonaismallissa saattaa olla vahvaa, tilastollisesti riittävää selitysvoimaa, mutta se ei pysty identifioimaan, johtuuko vaikutus pääasiassa työttömyysasteesta vai uusista alkuperäisistä työttömyyshakemuksista. Tämän VIF havaitsi, ja se ehdottaisi, että jokin muuttujista poistettaisiin mallista tai löydettäisiin jokin keino niiden konsolidoimiseksi niiden yhteisvaikutuksen vangitsemiseksi riippuen siitä, mitä hypoteesia tutkija on kiinnostunut testaamaan.
Kohokohdat
Varianssiinflaatiokerroin (VIF) mittaa riippumattomien muuttujien multikollineaarisuutta moniregressiomallissa.
Multikollineaarisuuden havaitseminen on tärkeää, koska vaikka multikollineaarisuus ei vähennä mallin selitysvoimaa, se vähentää riippumattomien muuttujien tilastollista merkitsevyyttä.
Suuri varianssiinflaatiokerroin (VIF) riippumattomassa muuttujassa osoittaa erittäin kollineaarista suhdetta muihin muuttujiin, jotka tulisi ottaa huomioon tai korjata mallin rakenteessa ja riippumattomien muuttujien valinnassa.