Investor's wiki

Chi-Square (χ2) Statistik

Chi-Square (χ2) Statistik

Vad Àr en chi-kvadratstatistik?

En chi-kvadrat (χ2) ^^statistik Ă€r ett test som mĂ€ter hur en modell jĂ€mförs med faktiska observerade data. Datan som anvĂ€nds för att berĂ€kna en chi-kvadratstatistik mĂ„ste vara slumpmĂ€ssig, rĂ„, ömsesidigt uteslutande,. hĂ€mtad frĂ„n oberoende variabler och hĂ€mtad frĂ„n ett tillrĂ€ckligt stort urval. Till exempel uppfyller resultaten av att kasta ett rĂ€ttvist mynt dessa kriterier.

Chi-kvadrattest anvÀnds ofta i hypotestestning. Chi-kvadratstatistiken jÀmför storleken pÄ eventuella avvikelser mellan de förvÀntade resultaten och de faktiska resultaten, givet storleken pÄ urvalet och antalet variabler i sambandet.

För dessa tester anvÀnds frihetsgrader för att avgöra om en viss nollhypotes kan förkastas baserat pÄ det totala antalet variabler och prover inom experimentet. Som med all statistik, ju större urvalsstorlek, desto mer tillförlitliga resultat.

Formeln för Chi-Square Àr

χc2 =∑(O i−Ei)2Ei</ mfrac></ mtd>dĂ€r: c=FrihetsgraderO=Observerade vĂ€rdenE=FörvĂ€ntade vĂ€rden\begin&\chi^2_c = \sum \frac{(O_i - E_i )^2} \&\textbf{dĂ€r:}\&c=\text\&O=\text{Observerat vĂ€rde(n)}\&E =\text{FörvĂ€ntat vĂ€rde(n)}\end

Vad sÀger en Chi-Square-statistik dig?

Det finns tvÄ huvudsakliga typer av chi-kvadrattest: testet av oberoende, som stÀller en frÄga om relation, till exempel "Finns det ett samband mellan studentkön och kursval?"; och godhet-of-fit-testet,. som frÄgar nÄgot i stil med "Hur vÀl matchar myntet i min hand ett teoretiskt rÀttvist mynt?"

Chi-kvadratanalys tillÀmpas pÄ kategoriska variabler och Àr sÀrskilt anvÀndbar nÀr dessa variabler Àr nominella (dÀr ordningen inte spelar nÄgon roll, som civilstÄnd eller kön).

Oberoende

NĂ€r man övervĂ€ger elevkön och kursval kan ett χ2-test för oberoende anvĂ€ndas. För att göra detta test skulle forskaren samla in data om de tvĂ„ valda variablerna (kön och valda kurser) och sedan jĂ€mföra frekvenserna vid vilka manliga och kvinnliga studenter vĂ€ljer bland de erbjudna klasserna med hjĂ€lp av formeln ovan och en χ^ 2^ statistisk tabell.

Om det inte finns nÄgot samband mellan kön och kursurval (det vill sÀga om de Àr oberoende), bör den faktiska frekvensen vid vilken manliga och kvinnliga studenter vÀljer varje erbjuden kurs förvÀntas vara ungefÀr lika, eller omvÀnt, andelen manliga och kvinnliga studenter i valfri vald kurs bör vara ungefÀr lika med andelen manliga och kvinnliga studenter i urvalet.

Ett χ2-test för oberoende kan berĂ€tta hur troligt det Ă€r att slumpmĂ€ssig slump kan förklara eventuella observerade skillnader mellan de faktiska frekvenserna i datan och dessa teoretiska förvĂ€ntningar.

Goodness-of-Fit

χ2 ger ett sĂ€tt att testa hur vĂ€l ett urval av data matchar de (kĂ€nda eller antagna) egenskaperna hos den större populationen som urvalet Ă€r avsett att representera. Detta Ă€r kĂ€nt som god passform. Om urvalsdata inte stĂ€mmer överens med de förvĂ€ntade egenskaperna hos populationen som vi Ă€r intresserade av, skulle vi inte vilja anvĂ€nda detta urval för att dra slutsatser om den större populationen.

Exempel

TÀnk till exempel pÄ ett imaginÀrt mynt med exakt 50/50 chans att landa huvuden eller svansar och ett riktigt mynt som du kastar 100 gÄnger. Om detta mynt Àr rÀttvist, kommer det ocksÄ att ha lika stor sannolikhet att landa pÄ bÄda sidor, och det förvÀntade resultatet av att kasta myntet 100 gÄnger Àr att huvuden kommer upp 50 gÄnger och svansar kommer upp 50 gÄnger.

I det hĂ€r fallet kan χ2 berĂ€tta för oss hur vĂ€l de faktiska resultaten av 100 myntvĂ€ndningar kan jĂ€mföras med den teoretiska modellen att ett rĂ€ttvist mynt ger 50/50 resultat. Den faktiska kastningen kan komma upp 50/50, eller 60/40, eller till och med 90/10. Ju lĂ€ngre bort det faktiska resultatet av de 100 kasten Ă€r frĂ„n 50/50, desto mindre bra passar denna uppsĂ€ttning kast till den teoretiska förvĂ€ntningen pĂ„ 50/50, och desto mer sannolikt kan vi dra slutsatsen att detta mynt faktiskt inte Ă€r en rĂ€ttvist mynt.

NÀr ska man anvÀnda ett chi-kvadrattest

Ett chi-kvadrattest anvÀnds för att avgöra om observerade resultat Àr i linje med förvÀntade resultat, och för att utesluta att observationer beror pÄ slumpen. Ett chi-kvadrattest Àr lÀmpligt för detta nÀr data som analyseras Àr frÄn ett slumpmÀssigt urval och nÀr variabeln i frÄga Àr en kategorisk variabel. En kategorisk variabel Àr en som bestÄr av urval som typ av bil, ras, utbildningsnivÄ, manlig vs. kvinna, hur mycket nÄgon gillar en politisk kandidat (frÄn vÀldigt mycket till vÀldigt lite) etc.

Dessa typer av data samlas ofta in via enkÀtsvar eller enkÀter. DÀrför Àr chi-kvadratanalys ofta mest anvÀndbar för att analysera denna typ av data.

Höjdpunkter

  • χ2 beror pĂ„ storleken pĂ„ skillnaden mellan faktiska och observerade vĂ€rden, frihetsgraderna och urvalsstorleken.

  • En chi-kvadrat (χ2) ^^statistik Ă€r ett mĂ„tt pĂ„ skillnaden mellan de observerade och förvĂ€ntade frekvenserna av utfallen av en uppsĂ€ttning hĂ€ndelser eller variabler.

  • Chi-kvadrat Ă€r anvĂ€ndbart för att analysera sĂ„dana skillnader i kategoriska variabler, sĂ€rskilt de som Ă€r nominella.

  • Den kan ocksĂ„ anvĂ€ndas för att testa godheten av passformen mellan en observerad fördelning och en teoretisk fördelning av frekvenser.

  • χ2 kan anvĂ€ndas för att testa om tvĂ„ variabler Ă€r relaterade eller oberoende av varandra.

Vanliga frÄgor

AnvÀnds chi-kvadratanalys nÀr den oberoende variabeln Àr nominell eller ordinal?

En nominell variabel Àr en kategorisk variabel som skiljer sig Ät efter kvalitet, men vars numeriska ordning kan vara irrelevant. Att till exempel frÄga nÄgon om sin favoritfÀrg skulle ge en nominell variabel. Att frÄga nÄgons Älder skulle Ä andra sidan producera en ordinarie uppsÀttning data. Chi-kvadrat kan bÀst appliceras pÄ nominella data.

Vem anvÀnder chi-kvadratanalys?

Eftersom chi-kvadrat gÀller kategoriska variabler, anvÀnds det mest av forskare som studerar enkÀtsvarsdata. Denna typ av forskning kan strÀcka sig frÄn demografi till konsument- och marknadsundersökningar till statsvetenskap och ekonomi.

Vad anvÀnds ett chi-kvadrattest till?

Chi-square Àr ett statistiskt test som anvÀnds för att undersöka skillnaderna mellan kategoriska variabler frÄn ett slumpmÀssigt urval för att bedöma god passform mellan förvÀntade och observerade resultat.