Homoskedastisk
Hva er homoskedastisk?
Homoskedastisk (ogsÄ stavet "homoskedastisk") refererer til en tilstand der variansen til gjenvÊrende, eller feilledd,. i en regresjonsmodell er konstant. Det vil si at feilleddet ikke varierer mye ettersom verdien av prediktorvariabelen endres. En annen mÄte Ä si dette pÄ er at variansen til datapunktene er omtrent lik for alle datapunktene.
Dette antyder et nivÄ av konsistens og gjÞr det lettere Ä modellere og arbeide med dataene gjennom regresjon; Imidlertid kan mangelen pÄ homoskedastisitet tyde pÄ at regresjonsmodellen kan trenge Ä inkludere ytterligere prediktorvariabler for Ä forklare ytelsen til den avhengige variabelen.
Hvordan homoskedastisitet fungerer
Homoskedastisitet er en antagelse om li nÊr regresjonsmodellering og data av denne typen fungerer godt med minste kvadraters metode. Hvis variansen av feilene rundt regresjonslinjen varierer mye, kan regresjonsmodellen vÊre dÄrlig definert.
Det motsatte av homoskedastisitet er heteroskedastisitet akkurat som det motsatte av «homogen» er «heterogen». Heteroskedastisitet (ogsÄ stavet "heteroscedastisitet") refererer til en tilstand der variansen til feilleddet i en regresjonsligning ikke er konstant.
Spesielle hensyn
En enkel regresjonsmodell, eller ligning, bestÄr av fire ledd. PÄ venstre side er den avhengige variabelen. Den representerer fenomenet modellen sÞker Ä «forklare». PÄ hÞyre side er en konstant, en prediktorvariabel og et restledd, eller feilledd. Feilleddet viser mengden variasjon i den avhengige variabelen som ikke er forklart av prediktorvariabelen.
Eksempel pÄ Homoskedastic
Anta for eksempel at du Þnsket Ä forklare studenttestresultatene ved Ä bruke tiden hver student brukte pÄ Ä studere. I dette tilfellet vil testresultatene vÊre den avhengige variabelen og tiden brukt pÄ Ä studere vil vÊre prediktorvariabelen.
Feilbegrepet vil vise mengden av varians i testresultatene som ikke ble forklart av hvor mye tid du studerer. Hvis denne variansen er ensartet, eller homoskedastisk, vil det tyde pÄ at modellen kan vÊre en tilstrekkelig forklaring pÄ testytelse - og forklare den i form av tid brukt pÄ Ä studere.
Men variansen kan vÊre heteroskedastisk. Et plott av feiltermdataene kan vise at en stor mengde studietid samsvarte veldig tett med hÞye testskÄrer, men at lave testresultater for studietid varierte mye og til og med inkluderte noen svÊrt hÞye scorer.
SÄ variansen av poengsum vil ikke bli godt forklart bare av en prediktorvariabel - mengden av tid Ä studere. I dette tilfellet er det sannsynligvis en annen faktor som virker, og modellen mÄ kanskje forbedres for Ä identifisere den eller dem.
NÄr man vurderer at variansen er den mÄlte forskjellen mellom det predikerte utfallet og det faktiske utfallet av en gitt situasjon, kan bestemmelse av homoskedastisitet bidra til Ä bestemme hvilke faktorer som mÄ justeres for nÞyaktighet.
Ytterligere undersÞkelser kan avslÞre at noen elever hadde sett svarene pÄ testen pÄ forhÄnd, eller at de tidligere hadde tatt en lignende test, og derfor ikke trengte Ä studere til denne spesielle testen. For den saks skyld kan det bare vise seg at studentene hadde ulike nivÄer av bestÄelsesevner uavhengig av studietid og prestasjoner pÄ tidligere prÞver, uavhengig av emne.
For Ä forbedre regresjonsmodellen, mÄ forskeren prÞve ut andre forklaringsvariabler som kan gi en mer nÞyaktig tilpasning til dataene. Hvis for eksempel noen elever hadde sett svarene pÄ forhÄnd, ville regresjonsmodellen da hatt to forklaringsvariabler: tidsstudier, og om eleven hadde forkunnskaper om svarene.
Med disse to variablene vil mer av variansen til testresultatene bli forklart, og variansen til feilbegrepet kan da vÊre homoskedastisk, noe som tyder pÄ at modellen var veldefinert.
HĂžydepunkter
â Hvis variansen til feilleddet er homoskedastisk, var modellen godt definert. Hvis det er for mye variasjon, kan det hende at modellen ikke er godt definert.
Homoskedastisitet oppstÄr nÄr variansen til feilleddet i en regresjonsmodell er konstant.
Motsatt oppstÄr heteroskedastisitet nÄr variansen til feilleddet ikke er konstant.
Ă legge til flere prediktorvariabler kan bidra til Ă„ forklare ytelsen til den avhengige variabelen.
FAQ
Hvorfor er homoskedastisitet viktig?
Homoskedastisitet er viktig fordi det identifiserer ulikheter i en befolkning. Enhver variasjon i en populasjon eller utvalg som ikke er jevn, vil gi resultater som er skjeve eller partiske, noe som gjĂžr analysen feil eller verdilĂžs.
Hva betyr heteroskedastisitet?
Heteroskedastisitet i statistikk er feilvariansen. Dette er avhengigheten av spredning som oppstÄr i et utvalg med minimum én uavhengig variabel. Dette betyr at standardavviket til en forutsigbar variabel er ikke-konstant.
Hvordan kan du vite om en regresjon er homoskedastisk?
Du kan se om en regresjon er homoskedastisk ved Ä se pÄ forholdet mellom den stÞrste variansen og den minste variansen. Hvis forholdet er 1,5 eller mindre, er regresjonen homoskedastisk.