Investor's wiki

Chi-Square (χ2) Statistik

Chi-Square (χ2) Statistik

Hvad er en Chi-Square-statistik?

En chi-kvadrat (χ2) ^^statistik er en test, der måler, hvordan en model kan sammenlignes med faktiske observerede data. De data,. der bruges til at beregne en chi-kvadratstatistik , skal være tilfældige, rå, gensidigt udelukkende,. trukket fra uafhængige variable og trukket fra en stor nok stikprøve. For eksempel opfylder resultaterne af at kaste en fair mønt disse kriterier.

Chi-kvadrattest bruges ofte til hypotesetestning. Chi-kvadrat-statistikken sammenligner størrelsen af eventuelle uoverensstemmelser mellem de forventede resultater og de faktiske resultater, givet størrelsen af stikprøven og antallet af variable i forholdet.

Til disse tests bruges frihedsgrader til at bestemme, om en bestemt nulhypotese kan forkastes baseret på det samlede antal variabler og prøver i eksperimentet. Som med enhver statistik, jo større stikprøvestørrelse, jo mere pålidelige resultater.

Formlen for Chi-Square er

χc2 =(O iEi)2Ei</ mfrac></ mtd>hvor: c=FrihedsgraderO=Observerede værdi(er)E=Forventet(e) værdi(er)\begin&\chi^2_c = \sum \frac{(O_i - E_i )^2} \&\textbf\&c=\text\&O=\text{Observeret(e) værdi(er)}\&E =\text{Forventet værdi(er)}\end

Hvad fortæller en Chi-Square-statistik dig?

Der er to hovedtyper af chi-square-tests: testen af uafhængighed, som stiller et spørgsmål om forhold, såsom: "Er der en sammenhæng mellem elevens køn og kursusvalg?"; og goodness-of-fit-testen,. der spørger noget som "Hvor godt matcher mønten i min hånd en teoretisk retfærdig mønt?"

Chi-kvadratanalyse anvendes på kategoriske variabler og er især nyttig, når disse variabler er nominelle (hvor rækkefølgen er ligegyldig, f.eks. civilstand eller køn).

Uafhængighed

Når elevernes køn og kursusvalg overvejes, kan en χ2 test for uafhængighed bruges. For at udføre denne test ville forskeren indsamle data om de to valgte variabler (køn og udvalgte kurser) og derefter sammenligne de frekvenser, hvormed mandlige og kvindelige studerende vælger blandt de tilbudte klasser ved hjælp af formlen givet ovenfor og en χ^ 2^ statistisk tabel.

Hvis der ikke er nogen sammenhæng mellem køn og kursusudvælgelse (det vil sige, hvis de er uafhængige), så bør de faktiske frekvenser, hvormed mandlige og kvindelige studerende vælger hvert tilbudt kursus forventes at være omtrent lige meget, eller omvendt, andelen af mandlige og kvindelige studerende. kvindelige studerende i ethvert udvalgt kursus bør være omtrent lig med andelen af mandlige og kvindelige studerende i stikprøven.

En χ2 test for uafhængighed kan fortælle os, hvor sandsynligt det er, at tilfældig tilfældighed kan forklare enhver observeret forskel mellem de faktiske frekvenser i dataene og disse teoretiske forventninger.

Goodness-of-Fit

χ2 giver en måde at teste, hvor godt en stikprøve af data matcher de (kendte eller formodede) karakteristika for den større population, som prøven er beregnet til at repræsentere. Dette er kendt som god pasform. Hvis stikprøvedataene ikke passer til de forventede egenskaber for den population, vi er interesserede i, så ønsker vi ikke at bruge denne stikprøve til at drage konklusioner om den større population.

Eksempel

Overvej for eksempel en imaginær mønt med præcis 50/50 chance for at lande hoveder eller haler og en rigtig mønt, som du kaster 100 gange. Hvis denne mønt er fair, så vil den også have lige stor sandsynlighed for at lande på begge sider, og det forventede resultat af at kaste mønten 100 gange er, at hoveder vil komme op 50 gange og haler vil komme op 50 gange.

I dette tilfælde kan χ2 fortælle os, hvor godt de faktiske resultater af 100 møntvendinger er sammenlignet med den teoretiske model, at en retfærdig mønt vil give 50/50 resultater. Selve kastet kunne komme op på 50/50 eller 60/40 eller endda 90/10. Jo længere væk de faktiske resultater af de 100 kast er fra 50/50, jo mindre god passer dette sæt kast til den teoretiske forventning på 50/50, og jo mere sandsynligt kan vi konkludere, at denne mønt faktisk ikke er en fair mønt.

Hvornår skal man bruge en Chi-Square-test

En chi-kvadrattest bruges til at afgøre, om observerede resultater er i overensstemmelse med forventede resultater, og til at udelukke, at observationer skyldes tilfældigheder. En chi-kvadrattest er passende til dette, når dataene, der analyseres, er fra en tilfældig stikprøve,. og når den pågældende variabel er en kategorisk variabel. En kategorisk variabel er en, der består af valg såsom biltype, race, uddannelsesniveau, mand vs. kvinde, hvor meget nogen kan lide en politisk kandidat (fra meget til meget lidt) osv.

Disse typer data indsamles ofte via undersøgelsessvar eller spørgeskemaer. Derfor er chi-square-analyse ofte mest anvendelig til at analysere denne type data.

Højdepunkter

  • χ2 afhænger af størrelsen af forskellen mellem faktiske og observerede værdier, frihedsgrader og stikprøvestørrelsen.

  • En chi-kvadrat (χ2) ^^statistik er et mål for forskellen mellem de observerede og forventede frekvenser af udfaldene af et sæt begivenheder eller variable.

  • Chi-kvadrat er nyttigt til at analysere sådanne forskelle i kategoriske variabler, især dem af nominelle karakter.

  • Det kan også bruges til at teste goodness-of-fit mellem en observeret fordeling og en teoretisk fordeling af frekvenser.

  • χ2 kan bruges til at teste, om to variable er relaterede eller uafhængige af hinanden.

Ofte stillede spørgsmål

Anvendes chi-kvadratanalyse, når den uafhængige variabel er nominel eller ordinær?

En nominel variabel er en kategorisk variabel, der adskiller sig efter kvalitet, men hvis numeriske rækkefølge kan være irrelevant. Hvis du for eksempel spørger nogen om deres yndlingsfarve, vil det producere en nominel variabel. At spørge om nogens alder ville på den anden side producere et ordinært sæt data. Chi-kvadrat kan bedst anvendes på nominelle data.

Hvem bruger Chi-Square-analyse?

Da chi-kvadrat gælder for kategoriske variabler, er det mest brugt af forskere, der studerer undersøgelsessvardata. Denne type forskning kan spænde fra demografi til forbruger- og marketingforskning til statskundskab og økonomi.

Hvad bruges en chi-kvadrattest til?

Chi-square er en statistisk test, der bruges til at undersøge forskellene mellem kategoriske variabler fra en tilfældig prøve for at bedømme god pasform mellem forventede og observerede resultater.