Homoskedastista
Mikä on Homoskedastic?
Homoskedasti (myös "homoskedastinen") viittaa tilaan, jossa regressiomallin residuaalin eli virhetermin varianssi on vakio. Eli virhetermi ei vaihtele paljon ennustajamuuttujan arvon muuttuessa. Toinen tapa sanoa tämä on, että datapisteiden varianssi on suunnilleen sama kaikille datapisteille.
Tämä ehdottaa johdonmukaisuuden tasoa ja helpottaa tietojen mallintamista ja käsittelyä regression avulla. kuitenkin homoskedastisuuden puute voi viitata siihen, että regressiomalli saattaa joutua sisällyttämään lisää ennustajamuuttujia selittämään riippuvan muuttujan suorituskykyä.
Kuinka Homoskedasticity toimii
Homoskedastisuus on yksi li lähellä regressiomallinnuksen oletus ja tämän tyyppiset tiedot toimivat hyvin pienimmän neliösumman menetelmällä. Jos virheiden varianssi regressioviivan ympärillä vaihtelee paljon, regressiomalli voi olla huonosti määritelty.
Homoskedastisuuden vastakohta on heteroskedastisuus, aivan kuten "homogeenisen" vastakohta on "heterogeenisuus". Heteroskedastisuudella (myös "heteroskedastisuudella") tarkoitetaan tilaa, jossa regressioyhtälön virhetermin varianssi ei ole vakio.
Erityisiä huomioita
Yksinkertainen regressiomalli tai yhtälö koostuu neljästä termistä. Vasemmalla puolella on riippuva muuttuja. Se edustaa ilmiötä, jota malli pyrkii "selittämään". Oikealla puolella ovat vakio, ennustava muuttuja ja jäännös- tai virhetermi. Virhetermi osoittaa riippuvaisen muuttujan vaihtelun määrän, jota ennustajamuuttuja ei selitä.
Esimerkki Homoskedasticista
Oletetaan esimerkiksi, että haluat selittää opiskelijoiden testitulokset käyttämällä aikaa, jonka kukin opiskelija käytti opiskeluun. Tässä tapauksessa testipisteet olisivat riippuvainen muuttuja ja opiskeluun käytetty aika olisi ennustava muuttuja.
Virhetermi osoittaisi testitulosten varianssin, jota ei selitetty opiskeluajalla. Jos tämä varianssi on tasainen tai homoskedastinen, se viittaa siihen, että malli voi olla riittävä selitys testin suorituskyvylle - selittäen sen opiskeluaikana.
Mutta varianssi voi olla heteroskedastinen. Virhetermitietojen kuvaaja saattaa osoittaa, että suuri määrä tutkimusaikaa vastasi hyvin läheisesti korkeita testipisteitä, mutta alhaiset opiskeluajan testipisteet vaihtelivat suuresti ja sisälsivät jopa erittäin korkeita pisteitä.
Joten pisteiden varianssia ei selittäisi hyvin yksinkertaisesti yhdellä ennustajamuuttujalla - opiskeluajan määrällä. Tässä tapauksessa jokin muu tekijä todennäköisesti vaikuttaa, ja mallia on ehkä parannettava sen tai niiden tunnistamiseksi.
Kun otetaan huomioon, että varianssi on mitattu ero ennustetun lopputuloksen ja tietyn tilanteen todellisen lopputuloksen välillä, homoskedastisuuden määrittäminen voi auttaa määrittämään, mitkä tekijät on mukautettava tarkkuuden vuoksi.
Lisätutkimukset voivat paljastaa, että jotkut opiskelijat olivat nähneet kokeen vastaukset etukäteen tai että he olivat aiemmin tehneet samanlaisen testin, joten heidän ei tarvinnut opiskella tätä koetta varten. Siinä tapauksessa voi vain käydä ilmi, että opiskelijoilla oli eri tasoisia kokeen läpäisykykyjä opiskeluajasta ja suorituksistaan aikaisemmissa kokeissa aineesta riippumatta.
Regressiomallin parantamiseksi tutkijan olisi kokeiltava muita selittäviä muuttujia, jotka voisivat tarjota tarkemman sovituksen dataan. Jos esimerkiksi jotkut opiskelijat olisivat nähneet vastaukset etukäteen, regressiomallissa olisi kaksi selittävää muuttujaa: opiskeluaika ja se, oliko opiskelijalla ennakkotietoa vastauksista.
Näillä kahdella muuttujalla selitettäisiin enemmän testitulosten varianssia ja virhetermin varianssi voisi silloin olla homoskedastista, mikä viittaa siihen, että malli oli hyvin määritelty.
Kohokohdat
Jos virhetermin varianssi on homoskedastinen, malli oli hyvin määritelty. Jos varianssia on liikaa, mallia ei ehkä ole määritelty hyvin.
Homoskedastisuus syntyy, kun regressiomallin virhetermin varianssi on vakio.
Sitä vastoin heteroskedastisuutta esiintyy, kun virhetermin varianssi ei ole vakio.
Muiden ennustajamuuttujien lisääminen voi auttaa selittämään riippuvan muuttujan suorituskyvyn.
UKK
Miksi homokedastiisuus on tärkeää?
Homoskedastisuus on tärkeä, koska se tunnistaa väestön eroavaisuudet. Kaikki epätasaiset varianssit populaatiossa tai otoksessa tuottaa vääristyneitä tai puolueellisia tuloksia, mikä tekee analyysistä virheellisen tai arvottoman.
Mitä heteroskedastisuus tarkoittaa?
Heteroskedastisuus tilastoissa on virhevarianssi. Tämä on riippuvuus sironnasta, joka esiintyy näytteessä, jossa on vähintään yksi riippumaton muuttuja. Tämä tarkoittaa, että ennustettavan muuttujan keskihajonta on ei-vakio.
Kuinka voit kertoa, onko taantuma homokedastinen?
Voit kertoa, onko regressio homoskedastinen tarkastelemalla suurimman ja pienimmän varianssin suhdetta. Jos suhde on 1,5 tai pienempi, regressio on homoskedastista.