Investor's wiki

Variansanalyse (ANOVA)

Variansanalyse (ANOVA)

Hva er variansanalyse (ANOVA)?

Variansanalyse (ANOVA) er et analyseverktøy som brukes i statistikk som deler en observert aggregert variasjon funnet inne i et datasett i to deler: systematiske faktorer og tilfeldige faktorer. De systematiske faktorene har statistisk innflytelse på det gitte datasettet, mens de tilfeldige faktorene ikke har det. Analytikere bruker ANOVA-testen for å bestemme innflytelsen som uavhengige variabler har på den avhengige variabelen i en regresjonsstudie.

T- og z-testmetodene utviklet på 1900-tallet ble brukt til statistisk analyse frem til 1918, da Ronald Fisher laget variansanalysemetoden. ANOVA kalles også Fisher variansanalyse, og det er forlengelsen av t- og z-testene. Begrepet ble kjent i 1925, etter å ha dukket opp i Fishers bok, "Statistical Methods for Research Workers." Den ble brukt i eksperimentell psykologi og senere utvidet til emner som var mer komplekse.

Formelen for ANOVA er:

F=MST MSE hvor:</ mtext></ mtd>F=ANOVA-koeffisient< /mtext>< /mtd>MST=Gjennomsnittlig sum av kvadrater på grunn av behandlingMSE=Gjennomsnittlig sum av kvadrater på grunn av feil\begin &\text = \frac{ \text }{ \text } \ &\textbf \ &\text = \text \ &\text = \text{Gjennomsnittlig sum av kvadrater på grunn av behandling} \ &\text = \text{Gjennomsnittlig sum av kvadrater på grunn av feil} \ \end

Hva avslører variansanalysen?

ANOVA-testen er det første trinnet i å analysere faktorer som påvirker et gitt datasett. Når testen er fullført, utfører en analytiker ytterligere testing på de metodiske faktorene som målbart bidrar til datasettets inkonsekvens. Analytikeren bruker ANOVA-testresultatene i en f-test for å generere tilleggsdata som stemmer overens med de foreslåtte regresjonsmodellene.

ANOVA-testen tillater en sammenligning av mer enn to grupper samtidig for å avgjøre om det eksisterer et forhold mellom dem. Resultatet av ANOVA-formelen, F-statistikken (også kalt F-forholdet), gjør det mulig å analysere flere grupper av data for å bestemme variasjonen mellom prøver og innenfor prøvene.

Hvis det ikke eksisterer noen reell forskjell mellom de testede gruppene, som kalles nullhypotesen,. vil resultatet av ANOVAs F-forholdsstatistikk være nær 1. Fordelingen av alle mulige verdier av F-statistikken er F-fordelingen. Dette er faktisk en gruppe fordelingsfunksjoner, med to karakteristiske tall, kalt tellerfrihetsgrader og nevnerfrihetsgrader.

Eksempel på hvordan du bruker ANOVA

En forsker kan for eksempel teste studenter fra flere høgskoler for å se om studenter fra en av høgskolene konsekvent overgår studenter fra de andre høgskolene. I en forretningsapplikasjon kan en FoU-forsker teste to forskjellige prosesser for å lage et produkt for å se om en prosess er bedre enn den andre når det gjelder kostnadseffektivitet.

Hvilken type ANOVA-test som brukes avhenger av en rekke faktorer. Den brukes når data må være eksperimentelle. Variansanalyse brukes hvis det ikke er tilgang til statistisk programvare, noe som resulterer i å beregne ANOVA for hånd. Den er enkel å bruke og passer best for små prøver. Med mange eksperimentelle design må prøvestørrelsene være de samme for de ulike faktornivåkombinasjonene.

ANOVA er nyttig for å teste tre eller flere variabler. Det ligner på flere to-prøver t-tester. Det resulterer imidlertid i færre type I-feil og passer for en rekke problemer. ANOVA grupperer forskjeller ved å sammenligne midlene til hver gruppe og inkluderer å spre variansen i forskjellige kilder. Det brukes med fag, testgrupper, mellom grupper og innenfor grupper.

Enveis ANOVA versus toveis ANOVA

Det er to hovedtyper av ANOVA: enveis (eller enveis) og toveis. Det finnes også varianter av ANOVA. For eksempel skiller MANOVA (multivariat ANOVA) seg fra ANOVA da førstnevnte tester for flere avhengige variabler samtidig mens sistnevnte vurderer bare én avhengig variabel om gangen. Enveis eller toveis refererer til antall uavhengige variabler i din variansanalysetest. En enveis ANOVA evaluerer virkningen av en eneste faktor på en eneste responsvariabel. Den avgjør om alle prøvene er like. Enveis ANOVA brukes til å bestemme om det er noen statistisk signifikante forskjeller mellom gjennomsnittene til tre eller flere uavhengige (urelaterte) grupper.

En toveis ANOVA er en forlengelse av enveis ANOVA. Med en enveis har du én uavhengig variabel som påvirker en avhengig variabel. Med en toveis ANOVA er det to uavhengige. For eksempel lar en toveis ANOVA et selskap sammenligne arbeiderens produktivitet basert på to uavhengige variabler, som lønn og ferdighetssett. Den brukes til å observere samspillet mellom de to faktorene og tester effekten av to faktorer samtidig.

##Høydepunkter

  • Hvis det ikke eksisterer noen sann varians mellom gruppene, bør ANOVAs F-forhold være nær 1.

  • En enveis ANOVA brukes for tre eller flere grupper av data, for å få informasjon om sammenhengen mellom de avhengige og uavhengige variablene.

  • Variansanalyse, eller ANOVA, er en statistisk metode som skiller observerte variansdata inn i ulike komponenter for å bruke for ytterligere tester.