Investor's wiki

Homoskedastisk

Homoskedastisk

Hvad er homoskedastik?

Homoskedastic (også stavet "homoskedastisk") refererer til en tilstand, hvor variansen af residual- eller fejltermen i en regressionsmodel er konstant. Det vil sige, at fejlleddet ikke varierer meget, da værdien af prædiktorvariablen ændres. En anden måde at sige dette på er, at variansen af datapunkterne er nogenlunde den samme for alle datapunkter.

Dette antyder et niveau af konsistens og gør det lettere at modellere og arbejde med data gennem regression; imidlertid kan manglen på homoskedasticitet tyde på, at regressionsmodellen muligvis skal inkludere yderligere prædiktorvariable for at forklare ydeevnen af den afhængige variabel.

Hvordan Homoskedasticitet virker

Homoskedasticitet er en antagelse om li nær regressionsmodellering og data af denne type fungerer godt med mindste kvadraters metode. Hvis variansen af fejlene omkring regressionslinjen varierer meget, kan regressionsmodellen være dårligt defineret.

Det modsatte af homoskedasticitet er heteroskedasticitet ligesom det modsatte af "homogen" er "heterogen". Heteroskedasticitet (også stavet "heteroscedasticitet") refererer til en tilstand, hvor variansen af fejlleddet i en regressionsligning ikke er konstant.

Særlige overvejelser

En simpel regressionsmodel eller ligning består af fire led. På venstre side er den afhængige variabel. Det repræsenterer det fænomen, modellen søger at "forklare". På højre side er en konstant, en forudsigelsesvariabel og et residual- eller fejlled. Fejlleddet viser mængden af variabilitet i den afhængige variabel, som ikke forklares af prædiktorvariablen.

Eksempel på Homoskedastic

Antag for eksempel, at du ville forklare elevernes testresultater ved at bruge den tid, hver elev brugte på at studere. I dette tilfælde ville testresultaterne være den afhængige variabel, og den tid brugt på at studere ville være prædiktorvariablen.

Fejlbegrebet ville vise mængden af varians i testresultaterne, der ikke blev forklaret med mængden af tid, der studerede. Hvis denne varians er ensartet eller homoskedastisk, så tyder det på, at modellen kan være en passende forklaring på testpræstationer - og forklare den i form af tid brugt på at studere.

Men variansen kan være heteroskedastisk. Et plot af fejltermdata kan vise, at en stor mængde studietid svarede meget tæt til høje testresultater, men at lave testresultater for undersøgelsestid varierede meget og endda inkluderede nogle meget høje scores.

Så variansen af scores ville ikke være velforklaret blot af én prædiktorvariabel - mængden af tid på at studere. I dette tilfælde er der sandsynligvis en anden faktor, der virker, og modellen skal muligvis forbedres for at identificere den eller dem.

Når man overvejer, at varians er den målte forskel mellem det forudsagte udfald og det faktiske udfald af en given situation, kan bestemmelse af homoskedasticitet hjælpe med at bestemme, hvilke faktorer der skal justeres for nøjagtighed.

Yderligere undersøgelser kan afsløre, at nogle elever havde set svarene på testen på forhånd, eller at de tidligere havde taget en lignende test, og derfor ikke behøvede at læse til netop denne test. For den sags skyld kan det bare vise sig, at eleverne havde forskellige niveauer af testbeståelsesevner uafhængigt af deres studietid og deres præstationer på tidligere test, uanset emnet.

For at forbedre regressionsmodellen skulle forskeren prøve andre forklarende variabler, der kunne give en mere præcis tilpasning til dataene. Hvis for eksempel nogle elever havde set svarene i forvejen, ville regressionsmodellen så have to forklaringsvariable: tidsstudier, og om eleven havde forhåndskendskab til svarene.

Med disse to variabler ville mere af variansen af testresultaterne blive forklaret, og variansen af fejltermen kan så være homoskedastisk, hvilket tyder på, at modellen var veldefineret.

##Højdepunkter

  • Hvis variansen af fejlleddet er homoskedastisk, var modellen veldefineret. Hvis der er for stor varians, er modellen muligvis ikke godt defineret.

  • Homoskedasticitet opstår, når variansen af fejlleddet i en regressionsmodel er konstant.

  • Modsat opstår heteroskedasticitet, når variansen af fejlleddet ikke er konstant.

  • Tilføjelse af yderligere prædiktorvariabler kan hjælpe med at forklare ydeevnen af den afhængige variabel.

##Ofte stillede spørgsmål

Hvorfor er homoskedasticitet vigtig?

Homoskedasticitet er vigtig, fordi den identificerer uligheder i en befolkning. Enhver varians i en population eller stikprøve, der ikke er ens, vil give resultater, der er skæve eller skæve, hvilket gør analysen forkert eller værdiløs.

Hvad betyder heteroskedasticitet?

Heteroskedasticitet i statistik er fejlvariansen. Dette er afhængigheden af spredning, der forekommer inden for en stikprøve med minimum én uafhængig variabel. Det betyder, at standardafvigelsen for en forudsigelig variabel er ikke-konstant.

Hvordan kan du vide, om en regression er homoskedastisk?

Du kan se, om en regression er homoskedastisk, ved at se på forholdet mellem den største varians og den mindste varians. Hvis forholdet er 1,5 eller mindre, så er regression homoskedastisk.