Varianssianalyysi (ANOVA)
Mikä on varianssianalyysi (ANOVA)?
Varianssianalyysi (ANOVA) on tilastoissa käytetty analyysityökalu, joka jakaa tietojoukon sisällä havaitun aggregoidun vaihtelun kahteen osaan: systemaattisiin tekijöihin ja satunnaistekijöihin. Systemaattisilla tekijöillä on tilastollinen vaikutus annettuun aineistoon, kun taas satunnaistekijöillä ei. Analyytikot käyttävät ANOVA-testiä määrittääkseen riippumattomien muuttujien vaikutuksen riippuvaan muuttujaan regressiotutkimuksessa.
t- ja z-testimenetelmiä käytettiin tilastolliseen analyysiin vuoteen 1918 asti, jolloin Ronald Fisher loi varianssianalyysimenetelmän. ANOVAa kutsutaan myös Fisherin varianssianalyysiksi, ja se on t- ja z-testien laajennus. Termi tuli tunnetuksi vuonna 1925, kun se esiintyi Fisherin kirjassa "Statistical Methods for Research Workers". Sitä käytettiin kokeellisessa psykologiassa ja laajennettiin myöhemmin monimutkaisempiin aiheisiin.
ANOVA:n kaava on:
Mitä varianssianalyysi paljastaa?
ANOVA-testi on ensimmäinen vaihe tiettyyn tietosarjaan vaikuttavien tekijöiden analysoinnissa. Kun testi on valmis, analyytikko suorittaa lisätestauksen metodisille tekijöille, jotka vaikuttavat mitattavasti tietojoukon epäjohdonmukaisuuteen. Analyytikko käyttää ANOVA-testin tuloksia f-testissä tuottaakseen lisädataa, joka on linjassa ehdotettujen regressiomallien kanssa.
ANOVA-testi mahdollistaa useamman kuin kahden ryhmän vertailun samanaikaisesti sen määrittämiseksi, onko niiden välillä olemassa suhdetta. ANOVA-kaavan tulos, F-tilasto (kutsutaan myös F-suhteeksi), mahdollistaa useiden tietoryhmien analysoinnin näytteiden välisen ja näytteiden sisäisen vaihtelun määrittämiseksi.
Jos testattujen ryhmien välillä ei ole todellista eroa, jota kutsutaan nollahypoteesiksi,. ANOVA:n F-suhteen tilaston tulos on lähellä 1. F-tilaston kaikkien mahdollisten arvojen jakauma on F-jakauma. Tämä on itse asiassa ryhmä jakautumisfunktioita, joissa on kaksi tunnuslukua, joita kutsutaan osoittajaksi vapausasteiksi ja nimittäjiksi vapausasteiksi.
Esimerkki ANOVA:n käytöstä
Tutkija voi esimerkiksi testata useiden korkeakoulujen opiskelijoita nähdäkseen, ovatko yhden korkeakoulun opiskelijat jatkuvasti parempia kuin muiden korkeakoulujen opiskelijat. Yrityssovelluksessa T&K-tutkija voi testata kahta erilaista tuotteen luomisprosessia nähdäkseen, onko toinen prosessi parempi kuin toinen kustannustehokkuuden kannalta.
Käytettävän ANOVA-testin tyyppi riippuu useista tekijöistä. Sitä käytetään, kun data on kokeellista. Varianssianalyysiä käytetään, jos ei ole pääsyä tilastolliseen ohjelmistoon, joka johtaa ANOVA:n laskemiseen käsin. Se on helppokäyttöinen ja sopii parhaiten pienille näytteille. Monissa kokeellisissa suunnitelmissa otoskokojen on oltava samat eri tekijätason yhdistelmissä.
ANOVA on hyödyllinen kolmen tai useamman muuttujan testaamiseen. Se on samanlainen kuin useat kahden otoksen t-testit. Se johtaa kuitenkin vähemmän tyypin I virheisiin ja sopii useisiin ongelmiin. ANOVA ryhmittelee erot vertaamalla kunkin ryhmän keskiarvoja ja sisältää varianssin jakamisen eri lähteisiin. Sitä käytetään koehenkilöiden, testiryhmien, ryhmien välillä ja ryhmien sisällä.
Yksisuuntainen ANOVA versus kaksisuuntainen ANOVA
ANOVAa on kahta päätyyppiä: yksisuuntainen (tai yksisuuntainen) ja kaksisuuntainen. ANOVAsta on myös muunnelmia. Esimerkiksi MANOVA (monimuuttuja ANOVA) eroaa ANOVAsta, koska edellinen testaa useita riippuvia muuttujia samanaikaisesti, kun taas jälkimmäinen arvioi vain yhden riippuvan muuttujan kerrallaan. Yksisuuntainen tai kaksisuuntainen viittaa riippumattomien muuttujien määrään varianssianalyysissäsi. Yksisuuntainen ANOVA arvioi yhden tekijän vaikutuksen ainoaan vastemuuttujaan. Se määrittää, ovatko kaikki näytteet samoja. Yksisuuntaista ANOVAa käytetään määrittämään, onko tilastollisesti merkitseviä eroja kolmen tai useamman riippumattoman (liittymättömän) ryhmän keskiarvojen välillä.
Kaksisuuntainen ANOVA on yksisuuntaisen ANOVA:n laajennus. Yhdellä tavalla sinulla on yksi riippumaton muuttuja, joka vaikuttaa riippuvaiseen muuttujaan. Kaksisuuntaisessa ANOVAssa on kaksi riippumatonta. Esimerkiksi kaksisuuntaisen ANOVA:n avulla yritys voi verrata työntekijöiden tuottavuutta kahden riippumattoman muuttujan, kuten palkan ja osaamisen perusteella. Sitä käytetään kahden tekijän välisen vuorovaikutuksen tarkkailuun ja kahden tekijän vaikutuksen testaamiseen samanaikaisesti.
##Kohokohdat
Jos ryhmien välillä ei ole todellista varianssia, ANOVA:n F-suhteen tulee olla lähellä yhtä.
Yksisuuntaista ANOVAa käytetään kolmelle tai useammalle tietoryhmälle, jotta saadaan tietoa riippuvien ja riippumattomien muuttujien välisestä suhteesta.
Varianssianalyysi eli ANOVA on tilastollinen menetelmä, joka erottaa havaitut varianssitiedot eri komponenteiksi lisätesteissä käytettäväksi.