Goodness-of-Fit
Hva er Goodness-of-Fit?
Begrepet goodness-of-fit refererer til en statistisk test som bestemmer hvor godt utvalgsdata passer til en fordeling fra en populasjon med normalfordeling. Enkelt sagt, den antar om et utvalg er skjevt eller representerer dataene du forventer å finne i den faktiske populasjonen.
Goodness-of-fit etablerer avviket mellom de observerte verdiene og de som forventes av modellen i et normalfordelingstilfelle. Det er flere metoder for å bestemme god passform, inkludert chi-square.
Forstå Goodness-of-Fit
Goodness-of-fit-tester er statistiske metoder som trekker slutninger om observerte verdier. Du kan for eksempel finne ut om en utvalgsgruppe virkelig er representativ for hele populasjonen. Som sådan bestemmer de hvordan faktiske verdier er relatert til de predikerte verdiene i en modell. Når de brukes i beslutningsprosesser, gjør goodness-of-fit-tester det lettere å forutsi trender og mønstre i fremtiden.
Som nevnt ovenfor finnes det flere typer godhetstester. De inkluderer kjikvadrattesten, som er den vanligste, samt Kolmogorov-Smirnov-testen og Shipiro-Wilk-testen. Testene utføres normalt ved hjelp av dataprogramvare. Men statistikere kan gjøre disse testene ved å bruke formler som er skreddersydd for den spesifikke typen test.
For å gjennomføre testen trenger du en viss variabel, sammen med en antagelse om hvordan den er fordelt. Du trenger også et datasett med klare og eksplisitte verdier, for eksempel:
De observerte verdiene, som er utledet fra det faktiske datasettet
De forventede verdiene, som er hentet fra de forutsetningene som er gjort
Det totale antallet kategorier i settet
Goodness-of-fit-tester brukes vanligvis for å teste for normaliteten til rester eller for å bestemme om to prøver er samlet fra identiske fordelinger.
Spesielle hensyn
For å tolke en godhetstest er det viktig for statistikere å etablere et alfanivå, for eksempel p-verdien for kjikvadrattesten. P-verdien refererer til sannsynligheten for å få resultater nær ekstreme av de observerte resultatene. Dette forutsetter at nullhypotesen er riktig. En nullhypotese hevder at det ikke er noen sammenheng mellom variabler, og den alternative hypotesen antar at det eksisterer en sammenheng.
I stedet måles frekvensen av de observerte verdiene og brukes deretter med de forventede verdiene og frihetsgradene til å beregne kjikvadrat. Hvis resultatet er lavere enn alfa, er nullhypotesen ugyldig, noe som indikerer at det eksisterer en sammenheng mellom variablene.
Typer godhetstester
Chi-Square Test
Kjikvadrattesten , som også er kjent som kjikvadrattesten for uavhengighet, er en inferensiell statistikkmetode som tester gyldigheten av en påstand om en populasjon basert på et tilfeldig utvalg.
Brukes utelukkende for data som er delt inn i klasser (binger), og krever tilstrekkelig utvalgsstørrelse for å gi nøyaktige resultater. Men det indikerer ikke typen eller intensiteten av forholdet. For eksempel konkluderer den ikke om forholdet er positivt eller negativt.
For å beregne en chi-square goodness-of-fit, angi ønsket alfa-nivå av signifikans. Så hvis konfidensnivået ditt er 95 % (eller 0,95), så er alfa 0,05. Deretter identifiserer du de kategoriske variablene som skal testes, og definerer deretter hypoteseutsagn om relasjonene mellom dem.
Variabler må være gjensidig utelukkende for å kvalifisere for kjikvadrattesten for uavhengighet. Og chi goodness-of-fit-testen bør ikke brukes for data som er kontinuerlig.
Kolmogorov-Smirnov-test
(F(Y i</ span>)− span class="vlist" style="height:0.855664em;">< span class="sizing reset-size6 size3 mtight">Ni−1 ,< span style="top:-2.6550000000000002em;">Ni−F( Yi< /span>))
Oppkalt etter russiske matematikere Andrey Kolmogorov og Nikolai Smirnov, Kolmogorov-Smirnov-testen (også kjent som KS-testen) er en statistisk metode som bestemmer om et utvalg er fra en spesifikk fordeling i en populasjon.
Denne testen, som anbefales for store prøver (f.eks. over 2000), er ikke-parametrisk. Det betyr at den ikke er avhengig av at noen distribusjon er gyldig. Målet er å bevise nullhypotesen, som er utvalget av normalfordelingen.
I likhet med kjikvadrat, bruker den en null og alternativ hypotese og et alfa-nivå av betydning. Null indikerer at dataene følger en spesifikk fordeling i populasjonen, og alternativ indikerer at dataene ikke fulgte en spesifikk fordeling i populasjonen. Alfaen brukes til å bestemme den kritiske verdien som brukes i testen. Men i motsetning til kjikvadrattesten, gjelder Kolmogorov-Smirnov-testen for kontinuerlige distribusjoner.
Den beregnede teststatistikken betegnes ofte som D. Den avgjør om nullhypotesen aksepteres eller forkastes. Hvis D er større enn den kritiske verdien ved alfa,. forkastes nullhypotesen. Hvis D er mindre enn den kritiske verdien, aksepteres nullhypotesen.
Shipiro-Wilk Test
< span class="mord">∑i=1n< /span>( span>x< /span>i − xˉ) 2 (∑.5 style="em;ight:2" style="em;ight:2" i =1n a span class="vlist" style="height:0.3280857142857143em;">i< /span>< span>( span class="mord mathnormal mtight">x(i ) )2,
Shipiro-Wilk-testen avgjør om en prøve følger en normalfordeling. Testen sjekker bare for normalitet når du bruker en prøve med én variabel med kontinuerlige data og anbefales for små prøvestørrelser opptil 2000.
Shipiro-Wilk-testen bruker et sannsynlighetsplott kalt QQ Plot, som viser to sett med kvantiler på y-aksen som er arrangert fra minste til største. Hvis hver kvantil kom fra samme fordeling, er seriene av plott lineære.
QQ-plotten brukes til å estimere variansen. Ved å bruke QQ Plot-varians sammen med den estimerte variansen til populasjonen, kan man bestemme om utvalget tilhører en normalfordeling. Hvis kvotienten til begge variansene er lik eller nær 1, kan nullhypotesen aksepteres. Hvis det er betydelig lavere enn 1, kan det avvises.
Akkurat som testene nevnt ovenfor, bruker denne alfa og danner to hypoteser: null og alternativ. Nullhypotesen sier at utvalget kommer fra normalfordelingen, mens den alternative hypotesen sier at utvalget ikke kommer fra normalfordelingen.
Goodness-of-Fit-eksempel
Her er et hypotetisk eksempel for å vise hvordan godhetstesten fungerer.
Anta at et lite fellestreningsstudio opererer under forutsetningen at det høyeste oppmøtet er på mandager, tirsdager og lørdager, gjennomsnittlig oppmøte på onsdager og torsdager, og lavest oppmøte på fredager og søndager. Basert på disse forutsetningene, sysselsetter treningsstudioet et visst antall ansatte hver dag for å sjekke inn medlemmer, rengjøre fasiliteter, tilby treningstjenester og undervise i klasser.
Men treningsstudioet presterer ikke bra økonomisk, og eieren vil vite om disse forutsetningene om oppmøte og bemanning er riktige. Eieren bestemmer seg for å telle antall treningsdeltakere hver dag i seks uker. De kan deretter sammenligne treningssenterets antatte oppmøte med dets observerte oppmøte, for eksempel ved å bruke en chi-kvadrats godhet-of-fit-test.
Nå som de har de nye dataene, kan de finne ut hvordan de best kan administrere treningsstudioet og forbedre lønnsomheten.
Bunnlinjen
Goodness-of-fit-tester bestemmer hvor godt utvalgsdata passer til det som forventes av en populasjon. Fra prøvedataene samles en observert verdi og sammenlignes med den beregnede forventede verdien ved hjelp av et avviksmål. Det finnes forskjellige hypotesetester for godhet av passform, avhengig av hvilket resultat du søker.
Å velge riktig godhetstest avhenger i stor grad av hva du vil vite om en prøve og hvor stor prøven er. Hvis du for eksempel vil vite om observerte verdier for kategoriske data samsvarer med de forventede verdiene for kategoriske data, bruk kjikvadrat. Hvis du ønsker å vite om et lite utvalg følger en normalfordeling, kan Shipiro-Wilk-testen være en fordel. Det er mange tester tilgjengelig for å fastslå god passform.
Høydepunkter
- En goodness-of-fit er en statistisk test som prøver å fastslå om et sett med observerte verdier samsvarer med de som forventes under den gjeldende modellen.
– De kan vise deg om prøvedataene dine passer til et forventet sett med data fra en populasjon med normalfordeling.
Kjikvadrattesten avgjør om det eksisterer en sammenheng mellom kategoriske data.
Det finnes flere typer godhetstester, men den vanligste er kjikvadrattesten.
– Kolmogorov-Smirnov-testen avgjør om et utvalg kommer fra en spesifikk fordeling av en populasjon.
FAQ
Hva er Goodness-of-Fit i Chi-Square-testen?
Kjikvadrattesten om det eksisterer sammenhenger mellom kategoriske variabler og om utvalget representerer helheten. Den anslår hvor tett de observerte dataene speiler de forventede dataene, eller hvor godt de passer.
Hva betyr god passform?
Goodness-of-Fit er en statistisk hypotesetest som brukes for å se hvor nøye observerte data speiler forventede data. Goodness-of-Fit-tester kan bidra til å avgjøre om et utvalg følger en normalfordeling, om kategoriske variabler er relatert, eller om tilfeldige utvalg er fra samme fordeling.
Hvordan gjør du godhetstesten?
Goodness-of-FIt-testen består av ulike testmetoder. Målet med testen vil bidra til å avgjøre hvilken metode som skal brukes. For eksempel, hvis målet er å teste normalitet på et relativt lite utvalg, kan Shipiro-Wilk-testen være egnet. Hvis man ønsker å finne ut om et utvalg kom fra en spesifikk fordeling i en populasjon, vil Kolmogorov-Smirnov-testen bli brukt. Hver test bruker sin egen unike formel. Imidlertid har de fellestrekk, som en nullhypotese og signifikansnivå.
Hvorfor er god passform viktig?
Goodness-of-Fit-tester hjelper deg med å avgjøre om observerte data stemmer overens med det som forventes. Beslutninger kan tas basert på resultatet av hypotesetesten som er utført. For eksempel ønsker en forhandler å vite hvilket produkttilbud som appellerer til unge mennesker. Forhandleren undersøker et tilfeldig utvalg av gamle og unge for å identifisere hvilket produkt som er foretrukket. Ved å bruke chi-square identifiserer de at det med 95 % sikkerhet eksisterer et forhold mellom produkt A og unge mennesker. Basert på disse resultatene kan det fastslås at dette utvalget representerer populasjonen av unge voksne. Detaljhandelsmarkedsførere kan bruke dette til å reformere kampanjene sine.