Homoskedastisk
Vad Àr homoskedastik?
Homoskedastic (Àven stavat "homoscedastic") hÀnvisar till ett tillstÄnd dÀr variansen för residual, eller felterm,. i en regressionsmodell Àr konstant. Det vill sÀga, feltermen varierar inte mycket eftersom vÀrdet pÄ prediktorvariabeln Àndras. Ett annat sÀtt att sÀga detta Àr att variansen för datapunkterna Àr ungefÀr densamma för alla datapunkter.
Detta antyder en nivÄ av konsekvens och gör det lÀttare att modellera och arbeta med data genom regression; dock kan avsaknaden av homoskedasticitet tyda pÄ att regressionsmodellen kan behöva inkludera ytterligare prediktorvariabler för att förklara prestandan hos den beroende variabeln.
Hur homoskedasticitet fungerar
Homoskedasticitet Àr ett antagande om li nÀra regressionsmodellering och data av denna typ fungerar bra med minsta kvadratmetoden. Om variansen av felen runt regressionslinjen varierar mycket kan regressionsmodellen vara dÄligt definierad.
Motsatsen till homoskedasticitet Àr heteroskedasticitet precis som motsatsen till "homogen" Àr "heterogen". Heteroskedasticitet (Àven stavat "heteroscedasticitet") hÀnvisar till ett tillstÄnd dÀr variansen för feltermen i en regressionsekvation inte Àr konstant.
SÀrskilda övervÀganden
En enkel regressionsmodell, eller ekvation, bestÄr av fyra termer. PÄ vÀnster sida finns den beroende variabeln. Den representerar det fenomen som modellen försöker "förklara". PÄ höger sida finns en konstant, en prediktorvariabel och en residual- eller felterm. Feltermen visar mÀngden variabilitet i den beroende variabeln som inte förklaras av prediktorvariabeln.
Exempel pÄ Homoskedastic
Anta till exempel att du ville förklara studenternas provresultat med hur lÄng tid varje elev spenderade pÄ att studera. I det hÀr fallet skulle testresultaten vara den beroende variabeln och tiden för studierna skulle vara prediktorvariabeln.
Feltermen skulle visa mÀngden varians i testresultaten som inte förklarades av hur lÄng tid det tog att studera. Om den variansen Àr enhetlig, eller homoskedastisk, skulle det tyda pÄ att modellen kan vara en adekvat förklaring för testprestanda - och förklarar den i termer av tid som spenderas pÄ att studera.
Men variansen kan vara heteroskedastisk. En plot av feltermsdata kan visa att en stor mÀngd studietid överensstÀmde mycket nÀra med höga testresultat men att lÄga studietidstestresultat varierade stort och till och med inkluderade nÄgra mycket höga poÀng.
SÄ variansen av poÀng skulle inte förklaras vÀl av enbart en prediktorvariabel - mÀngden tid att studera. I det hÀr fallet Àr det troligen nÄgon annan faktor som spelar in, och modellen kan behöva förbÀttras för att identifiera den eller dem.
NÀr man övervÀger att varians Àr den uppmÀtta skillnaden mellan det förutsagda utfallet och det faktiska utfallet av en given situation, kan bestÀmning av homoskedasticitet hjÀlpa till att avgöra vilka faktorer som behöver justeras för noggrannhet.
Ytterligare undersökningar kan avslöja att vissa elever hade sett svaren pÄ provet i förvÀg eller att de tidigare hade gjort ett liknande prov och dÀrför inte behövde plugga till just detta prov. För den delen kan det bara visa sig att eleverna hade olika nivÄer av godkÀnda förmÄgor oberoende av studietid och prestation pÄ tidigare prov, oavsett Àmne.
För att förbÀttra regressionsmodellen skulle forskaren behöva prova andra förklaringsvariabler som skulle kunna ge en mer exakt passning till data. Om till exempel nÄgra elever hade sett svaren i förvÀg skulle regressionsmodellen dÄ ha tvÄ förklaringsvariabler: tid att studera, och om eleven hade förkunskaper om svaren.
Med dessa tvÄ variabler skulle mer av variansen av testresultaten förklaras och variansen för feltermen kan dÄ vara homoskedastisk, vilket tyder pÄ att modellen var vÀldefinierad.
Höjdpunkter
â Om variansen pĂ„ feltermen Ă€r homoskedastisk var modellen vĂ€ldefinierad. Om det finns för stor varians kanske modellen inte Ă€r vĂ€l definierad.
- Homoskedasticitet uppstÄr nÀr variansen av feltermen i en regressionsmodell Àr konstant.
â Motsatt uppstĂ„r heteroskedasticitet nĂ€r variansen av feltermen inte Ă€r konstant.
- Att lÀgga till ytterligare prediktorvariabler kan hjÀlpa till att förklara prestandan för den beroende variabeln.
Vanliga frÄgor
Varför Àr homoskedasticitet viktigt?
Homoskedasticitet Àr viktigt eftersom det identifierar olikheter i en befolkning. Varje varians i en population eller ett urval som inte Àr jÀmn kommer att ge resultat som Àr snedstÀllda eller partiska, vilket gör analysen felaktig eller vÀrdelös.
Vad betyder heteroskedasticitet?
Heteroskedasticitet i statistik Àr felvariansen. Detta Àr beroendet av spridning som sker inom ett urval med minst en oberoende variabel. Detta innebÀr att standardavvikelsen för en förutsÀgbar variabel Àr icke-konstant.
Hur kan du avgöra om en regression Àr homoskedastisk?
Du kan se om en regression Àr homoskedastisk genom att titta pÄ förhÄllandet mellan den största variansen och den minsta variansen. Om förhÄllandet Àr 1,5 eller mindre Àr regressionen homoskedastisk.