Goodness-of-Fit
Hvad er Goodness-of-Fit?
Udtrykket goodness-of-fit refererer til en statistisk test, der bestemmer, hvor godt stikprøvedata passer til en fordeling fra en population med en normalfordeling. Forenklet sagt, antager det, om en stikprøve er skæv eller repræsenterer de data, du ville forvente at finde i den faktiske population.
Goodness-of-fit fastslår uoverensstemmelsen mellem de observerede værdier og dem, der forventes af modellen i et normalfordelingstilfælde. Der er flere metoder til at bestemme god pasform, herunder chi-square.
Forstå Goodness-of-Fit
Goodness-of-fit-test er statistiske metoder, der drager konklusioner om observerede værdier. For eksempel kan du afgøre, om en stikprøvegruppe virkelig er repræsentativ for hele populationen. Som sådan bestemmer de, hvordan faktiske værdier er relateret til de forudsagte værdier i en model. Når de bruges i beslutningstagning, gør goodness-of-fit-test det lettere at forudsige tendenser og mønstre i fremtiden.
Som nævnt ovenfor er der flere typer af godhed-of-fit-tests. De omfatter chi-square-testen, som er den mest almindelige, samt Kolmogorov-Smirnov-testen og Shipiro-Wilk-testen. Testene udføres normalt ved hjælp af computersoftware. Men statistikere kan udføre disse tests ved hjælp af formler, der er skræddersyet til den specifikke type test.
For at udføre testen har du brug for en bestemt variabel sammen med en antagelse om, hvordan den er fordelt. Du har også brug for et datasæt med klare og eksplicitte værdier, såsom:
De observerede værdier, som er afledt af det faktiske datasæt
De forventede værdier, som er taget ud fra de antagelser, der er gjort
Det samlede antal kategorier i sættet
Goodness-of-fit-tests bruges almindeligvis til at teste for normaliteten af residualer eller til at bestemme, om to prøver er indsamlet fra identiske fordelinger.
Særlige overvejelser
For at fortolke en godhed-of-fit-test er det vigtigt for statistikere at etablere et alfa-niveau, såsom p-værdien for chi-kvadrat-testen. P-værdien refererer til sandsynligheden for at få resultater tæt på yderpunkterne af de observerede resultater. Dette forudsætter, at nulhypotesen er korrekt. En nulhypotese hævder, at der ikke er nogen sammenhæng mellem variabler, og den alternative hypotese antager, at der eksisterer en sammenhæng.
I stedet måles frekvensen af de observerede værdier og bruges efterfølgende med de forventede værdier og frihedsgrader til at beregne chi-kvadrat. Hvis resultatet er lavere end alfa, er nulhypotesen ugyldig, hvilket indikerer, at der eksisterer en sammenhæng mellem variablerne.
Typer af godhed-of-fit-tests
Chi-Square Test
- square-testen,. som også er kendt som chi-square-testen for uafhængighed, er en inferentiel statistikmetode, der tester gyldigheden af en påstand om en population baseret på en tilfældig stikprøve.
Brugt udelukkende til data, der er opdelt i klasser (bins), kræver det en tilstrækkelig stikprøvestørrelse til at producere nøjagtige resultater. Men det indikerer ikke typen eller intensiteten af forholdet. For eksempel konkluderer den ikke, om forholdet er positivt eller negativt.
For at beregne en chi-square goodness-of-fit, skal du indstille det ønskede alfa-signifikansniveau. Så hvis dit konfidensniveau er 95 % (eller 0,95), så er alfa 0,05. Dernæst skal du identificere de kategoriske variabler, der skal testes, og derefter definere hypoteseudsagn om forholdet mellem dem.
Variabler skal være gensidigt udelukkende for at kvalificere sig til chi-square-testen for uafhængighed. Og chi goodness-of-fit-testen bør ikke bruges til data, der er kontinuerlige.
Kolmogorov-Smirnov Test
(F(Y i</ span>)−>< span class="vlist" style="height:0.855664em;">< span class="sizing reset-size6 size3 mtight">N>i−1 , < span style="top:-2.6550000000000002em;">Ni −F( Y i< / span>)) < /span>
Kolmogorov-Smirnov-testen (også kendt som KS-testen) er opkaldt efter de russiske matematikere Andrey Kolmogorov og Nikolai Smirnov og er en statistisk metode, der bestemmer, om en prøve er fra en specifik fordeling inden for en population.
Denne test, som anbefales til store prøver (f.eks. over 2000), er ikke-parametrisk. Det betyder, at den ikke er afhængig af nogen distribution for at være gyldig. Målet er at bevise nulhypotesen, som er stikprøven af normalfordelingen.
Ligesom chi-kvadrat bruger den en nul og alternativ hypotese og et alfa-niveau af betydning. Null angiver, at dataene følger en specifik fordeling inden for populationen, og alternativ angiver, at dataene ikke fulgte en specifik fordeling inden for populationen. Alfaen bruges til at bestemme den kritiske værdi, der bruges i testen. Men i modsætning til chi-kvadrat-testen gælder Kolmogorov-Smirnov-testen for kontinuerlige fordelinger.
Den beregnede teststatistik betegnes ofte som D. Den afgør, om nulhypotesen accepteres eller forkastes. Hvis D er større end den kritiske værdi ved alfa,. forkastes nulhypotesen. Hvis D er mindre end den kritiske værdi, accepteres nulhypotesen.
Shipiro-Wilk Test
< span class="mord">∑i=1n< /span>(</ span >x>< /span>i − xˉ) 2 (∑.5 style="em;ight:2" style="em;ight:2" i =1n a span class="vlist" style="height:0.3280857142857143em;">i< /span>< span >(< span class="mord mathnormal mtight">x(i ) )2,
Shipiro-Wilk-testen afgør, om en prøve følger en normalfordeling. Testen kontrollerer kun for normalitet, når der bruges en stikprøve med én variabel af kontinuerlige data og anbefales til små stikprøvestørrelser op til 2000.
Shipiro-Wilk-testen bruger et sandsynlighedsplot kaldet QQ Plot, som viser to sæt kvantiler på y-aksen, der er arrangeret fra mindste til største. Hvis hver kvantil kom fra den samme fordeling, er rækken af plots lineære.
QQ-plottet bruges til at estimere variansen. Ved at bruge QQ Plot-varians sammen med den estimerede varians af populationen kan man bestemme, om prøven tilhører en normalfordeling. Hvis kvotienten af begge varianser er lig med eller tæt på 1, kan nulhypotesen accepteres. Hvis det er væsentligt lavere end 1, kan det afvises.
Ligesom testene nævnt ovenfor, bruger denne alfa og danner to hypoteser: nul og alternativ. Nul-hypotesen angiver, at stikprøven kommer fra normalfordelingen, mens den alternative hypotese siger, at stikprøven ikke kommer fra normalfordelingen.
Goodness-of-Fit-eksempel
Her er et hypotetisk eksempel for at vise, hvordan god-tilpasningstesten fungerer.
Antag, at et lille fællesskabsmotionscenter opererer under den antagelse, at det højeste fremmøde er på mandage, tirsdage og lørdage, gennemsnitligt fremmøde på onsdage og torsdage, og laveste fremmøde på fredage og søndage. Baseret på disse antagelser beskæftiger fitnesscentret et vist antal medarbejdere hver dag til at tjekke medlemmer ind, rengøre faciliteter, tilbyde træningstjenester og undervise i klasser.
Men fitnesscentret klarer sig ikke godt økonomisk, og ejeren vil gerne vide, om disse fremmødeantagelser og personaleniveauer er korrekte. Ejeren beslutter sig for at tælle antallet af motionsdeltagere hver dag i seks uger. De kan derefter sammenligne fitnesscentrets formodede deltagelse med dets observerede deltagelse ved at bruge en chi-square goodness-of-fit test for eksempel.
Nu, hvor de har de nye data, kan de bestemme, hvordan de bedst administrerer træningscenteret og forbedrer rentabiliteten.
Bundlinjen
Goodness-of-fit-tests bestemmer, hvor godt stikprøvedata passer til det, der forventes af en population. Fra stikprøvedataene indsamles en observeret værdi og sammenlignes med den beregnede forventede værdi ved hjælp af et uoverensstemmelsesmål. Der er forskellige godheds-of-fit hypotesetests tilgængelige afhængigt af hvilket resultat du søger.
Valget af den rigtige goodness-of-fit-test afhænger i høj grad af, hvad du vil vide om en prøve, og hvor stor prøven er. For eksempel, hvis du vil vide, om observerede værdier for kategoriske data matcher de forventede værdier for kategoriske data, skal du bruge chi-kvadrat. Hvis du vil vide, om en lille prøve følger en normalfordeling, kan Shipiro-Wilk-testen være en fordel. Der er mange tests tilgængelige for at bestemme god pasform.
##Højdepunkter
En goodness-of-fit er en statistisk test, der forsøger at bestemme, om et sæt af observerede værdier matcher dem, der forventes under den gældende model.
De kan vise dig, om dine stikprøvedata passer til et forventet sæt data fra en population med normalfordeling.
Chi-kvadrat-testen afgør, om der er en sammenhæng mellem kategoriske data.
Der er flere typer godhed-of-fit-tests, men den mest almindelige er chi-square-testen.
Kolmogorov-Smirnov-testen afgør, om en prøve kommer fra en specifik fordeling af en population.
##Ofte stillede spørgsmål
Hvad er Goodness-of-Fit i Chi-Square-testen?
Chi-kvadrat-testen, om der eksisterer sammenhænge mellem kategoriske variable, og om stikprøven repræsenterer helheden. Det estimerer, hvor tæt de observerede data afspejler de forventede data, eller hvor godt de passer.
Hvad betyder Goodness-of-Fit?
Goodness-of-Fit er en statistisk hypotesetest, der bruges til at se, hvor tæt observerede data afspejler forventede data. Goodness-of-Fit-tests kan hjælpe med at afgøre, om en prøve følger en normalfordeling, om kategoriske variabler er relaterede, eller om tilfældige prøver er fra samme fordeling.
Hvordan laver du Goodness-of-Fit-testen?
Goodness-of-FIt testen består af forskellige testmetoder. Målet med testen vil hjælpe med at bestemme, hvilken metode der skal bruges. For eksempel, hvis målet er at teste normalitet på en relativt lille prøve, kan Shipiro-Wilk testen være egnet. Hvis man ønsker at afgøre, om en prøve kom fra en specifik fordeling inden for en population, vil Kolmogorov-Smirnov-testen blive brugt. Hver test bruger sin egen unikke formel. De har dog fællestræk, såsom en nulhypotese og et signifikansniveau.
Hvorfor er god pasform vigtig?
Goodness-of-Fit-tests hjælper med at afgøre, om observerede data stemmer overens med det forventede. Beslutninger kan træffes baseret på resultatet af den gennemførte hypotesetest. For eksempel vil en forhandler gerne vide, hvilket produktudbud der appellerer til unge mennesker. Forhandleren undersøger et tilfældigt udvalg af gamle og unge for at identificere, hvilket produkt der foretrækkes. Ved hjælp af chi-square identificerer de, at der med 95% sikkerhed eksisterer et forhold mellem produkt A og unge. Baseret på disse resultater kunne det fastslås, at denne prøve repræsenterer populationen af unge voksne. Detailmarkedsførere kan bruge dette til at reformere deres kampagner.