Investor's wiki

Variansanalyse (ANOVA)

Variansanalyse (ANOVA)

Hvad er variansanalyse (ANOVA)?

Variansanalyse (ANOVA) er et analyseværktøj, der bruges i statistik, der opdeler en observeret aggregeret variabilitet fundet inde i et datasæt i to dele: systematiske faktorer og tilfældige faktorer. De systematiske faktorer har en statistisk indflydelse på det givne datasæt, mens de tilfældige faktorer ikke har. Analytikere bruger ANOVA-testen til at bestemme den indflydelse, uafhængige variable har på den afhængige variabel i et regressionsstudie.

t- og z-testmetoderne udviklet i det 20. århundrede blev brugt til statistisk analyse indtil 1918, hvor Ronald Fisher skabte variansanalysemetoden. ANOVA kaldes også Fisher-variansanalysen, og det er en forlængelse af t- og z-testene. Udtrykket blev velkendt i 1925, efter at have optrådt i Fishers bog, "Statistical Methods for Research Workers." Det blev brugt i eksperimentel psykologi og senere udvidet til emner, der var mere komplekse.

Formlen for ANOVA er:

F=MST MSE hvor:</ mtext></ mtd>F=ANOVA-koefficient< /mtext>< /mtd>MST=Gennemsnitsum af kvadrater på grund af behandlingMSE=Middelsum af kvadrater på grund af fejl\begin &\text = \frac{ \text }{ \text } \ &\textbf \ &\text = \text \ &\text = \text{Middelsum af kvadrater på grund af behandling} \ &\text = \text{Middelsum af kvadrater på grund af fejl} \ \end

Hvad afslører variansanalysen?

ANOVA-testen er det indledende trin i at analysere faktorer, der påvirker et givet datasæt. Når testen er afsluttet, udfører en analytiker yderligere test af de metodiske faktorer, der målbart bidrager til datasættets inkonsistens. Analytikeren bruger ANOVA-testresultaterne i en f-test til at generere yderligere data, der stemmer overens med de foreslåede regressionsmodeller.

ANOVA-testen tillader en sammenligning af mere end to grupper på samme tid for at afgøre, om der er en sammenhæng mellem dem. Resultatet af ANOVA-formlen, F-statistikken (også kaldet F-forholdet), giver mulighed for analyse af flere grupper af data for at bestemme variabiliteten mellem prøver og inden for prøver.

Hvis der ikke er nogen reel forskel mellem de testede grupper, som kaldes nulhypotesen,. vil resultatet af ANOVA's F-ratio-statistik være tæt på 1. Fordelingen af alle mulige værdier af F-statistikken er F-fordelingen. Dette er faktisk en gruppe fordelingsfunktioner med to karakteristiske tal, kaldet tællerfrihedsgrader og nævnerfrihedsgrader.

Eksempel på hvordan man bruger ANOVA

En forsker kan for eksempel teste studerende fra flere gymnasier for at se, om studerende fra et af gymnasierne konsekvent klarer sig bedre end elever fra de andre gymnasier. I en forretningsapplikation kan en R&D-forsker teste to forskellige processer til at skabe et produkt for at se, om den ene proces er bedre end den anden med hensyn til omkostningseffektivitet.

Den anvendte type ANOVA-test afhænger af en række faktorer. Det anvendes, når data skal være eksperimentelle. Variansanalyse anvendes, hvis der ikke er adgang til statistisk software, hvilket resulterer i, at ANOVA beregnes manuelt. Den er nem at bruge og bedst egnet til små prøver. Med mange eksperimentelle designs skal stikprøvestørrelserne være de samme for de forskellige faktorniveaukombinationer.

ANOVA er nyttig til at teste tre eller flere variabler. Det ligner flere to-prøve t-tests. Det resulterer dog i færre type I-fejl og er passende til en række problemer. ANOVA grupperer forskelle ved at sammenligne midlerne for hver gruppe og inkluderer spredning af variansen i forskellige kilder. Det er ansat med fag, testgrupper, mellem grupper og inden for grupper.

Envejs ANOVA versus tovejs ANOVA

Der er to hovedtyper af ANOVA: envejs (eller ensrettet) og tovejs. Der er også variationer af ANOVA. For eksempel adskiller MANOVA (multivariat ANOVA) sig fra ANOVA, da førstnævnte tester for flere afhængige variabler samtidigt, mens sidstnævnte kun vurderer én afhængig variabel ad gangen. Envejs eller tovejs refererer til antallet af uafhængige variable i din variansanalysetest. En envejs ANOVA evaluerer virkningen af en eneste faktor på en eneste responsvariabel. Det bestemmer, om alle prøverne er ens. Envejs ANOVA bruges til at bestemme, om der er nogen statistisk signifikante forskelle mellem gennemsnittet af tre eller flere uafhængige (ikke-relaterede) grupper.

En tovejs ANOVA er en forlængelse af envejs ANOVA. Med en envejs har du én uafhængig variabel, der påvirker en afhængig variabel. Med en tovejs ANOVA er der to uafhængige. For eksempel giver en tovejs ANOVA en virksomhed mulighed for at sammenligne arbejdernes produktivitet baseret på to uafhængige variabler, såsom løn og kvalifikationssæt. Det bruges til at observere interaktionen mellem de to faktorer og tester effekten af to faktorer på samme tid.

##Højdepunkter

  • Hvis der ikke er nogen sand varians mellem grupperne, bør ANOVA's F-forhold være tæt på 1.

  • En envejs ANOVA bruges til tre eller flere grupper af data, for at få information om sammenhængen mellem de afhængige og uafhængige variable.

  • Variansanalyse, eller ANOVA, er en statistisk metode, der adskiller observerede variansdata i forskellige komponenter til brug for yderligere test.