Investor's wiki

Chi-kwadrat (χ2) Statystyka

Chi-kwadrat (χ2) Statystyka

Co to jest statystyka chi-kwadrat?

Statystyka chi-kwadrat (χ2) ^^ to test, który mierzy porównanie modelu z rzeczywistymi obserwowanymi danymi. Dane wykorzystywane do obliczania statystyki chi-kwadrat muszą być losowe, surowe, wzajemnie wykluczające się , pochodzące ze zmiennych niezależnych i pochodzące z odpowiednio dużej próby. Na przykład wyniki rzucania uczciwą monetą spełniają te kryteria.

Testy chi-kwadrat są często używane w testowaniu hipotez. Statystyka chi-kwadrat porównuje wielkość wszelkich rozbieżności między wynikami oczekiwanymi a wynikami rzeczywistymi, biorąc pod uwagę wielkość próby i liczbę zmiennych w relacji.

W przypadku tych testów wykorzystuje się stopnie swobody w celu określenia, czy pewna hipoteza zerowa może zostać odrzucona na podstawie całkowitej liczby zmiennych i próbek w eksperymencie. Jak w przypadku każdej statystyki, im większy rozmiar próbki, tym bardziej wiarygodne wyniki.

Formuła Chi-kwadrat to

χc2 =(O iEi)2Ei</ mfrac></ mtd>gdzie: <mstyle scriptlevel=" 0" styl wyświetlania = "t rue">c=Stopnie wolności<mstyle scriptlevel="0" styl wyświetlania ="true">O=Obserwowane wartościE=Oczekiwane wartości\begin&\chi^2_c = \sum \frac{(O_i - E_i )^2} \&\textbf\&c=\text{Stopień wolności}\&O=\text{Obserwowane wartości}\&E =\text{Oczekiwane wartości}\end{wyrównane}

Co mówi statystyka chi-kwadrat?

Istnieją dwa główne rodzaje testów chi-kwadrat: test niezależności, który zadaje pytanie o związek, np. „Czy istnieje związek między płcią ucznia a wyborem kursu?”; oraz test dopasowania,. który pyta coś w stylu „Jak dobrze moneta w mojej ręce pasuje do teoretycznie uczciwej monety?”

Analiza chi-kwadrat jest stosowana do zmiennych kategorialnych i jest szczególnie przydatna, gdy te zmienne są nominalne (gdzie kolejność nie ma znaczenia, jak stan cywilny czy płeć).

Niezależność

Rozważając płeć ucznia i wybór kursu, można zastosować χ2 test niezależności. Aby przeprowadzić ten test, badacz zbierał dane dotyczące dwóch wybranych zmiennych (wybranej płci i kierunków), a następnie porównywał częstotliwości wyboru spośród oferowanych zajęć przez studentów i studentki według wzoru podanego powyżej i χ^ 2^ tabela statystyczna.

Jeśli nie ma związku między płcią a wyborem kursu (tj. jeśli są one niezależne), należy oczekiwać, że rzeczywista częstotliwość, z jaką studenci i studenci wybierają każdy oferowany kurs, będzie w przybliżeniu równa lub odwrotnie proporcja mężczyzn i kobiet studentki na dowolnym wybranym kursie powinny być w przybliżeniu równe proporcji studentów płci męskiej i żeńskiej w próbie.

χ2 test niezależności może nam powiedzieć, jak prawdopodobne jest, że losowy przypadek może wyjaśnić każdą zaobserwowaną różnicę między rzeczywistymi częstościami w danych a tymi teoretycznymi oczekiwaniami.

Dobroć dopasowania

χ2 umożliwia sprawdzenie, jak dobrze próbka danych pasuje do (znanych lub zakładanych) cech większej populacji, którą próbka ma reprezentować. Nazywa się to dobrocią dopasowania. Jeśli dane próbki nie pasują do oczekiwanych właściwości populacji, która nas interesuje, nie chcielibyśmy używać tej próbki do wyciągania wniosków na temat większej populacji.

Przykład

Rozważmy na przykład wyimaginowaną monetę z dokładnie 50/50 szansą na wylądowanie orła lub reszki oraz prawdziwą monetę, którą rzucasz 100 razy. Jeśli ta moneta jest sprawiedliwa, to będzie miała równe prawdopodobieństwo wylądowania po obu stronach, a oczekiwany wynik rzucenia monetą 100 razy to 50 razy wypadnięcie orła, a 50 razy reszki.

W tym przypadku χ2 może nam powiedzieć, jak dobrze rzeczywiste wyniki 100 rzutów monetą wypada w porównaniu z teoretycznym modelem, że uczciwa moneta da wynik 50/50. Rzeczywisty rzut może wynieść 50/50, 60/40, a nawet 90/10. Im dalej rzeczywiste wyniki 100 rzutów są od 50/50, tym mniej dobre dopasowanie tego zestawu rzutów do teoretycznych oczekiwań 50/50 i tym bardziej prawdopodobne, że możemy dojść do wniosku, że ta moneta w rzeczywistości nie jest uczciwa moneta.

Kiedy używać testu chi-kwadrat

Test chi-kwadrat służy do określenia, czy zaobserwowane wyniki są zgodne z wynikami oczekiwanymi oraz do wykluczenia, że obserwacje są przypadkowe. Test chi-kwadrat jest odpowiedni do tego, gdy analizowane dane pochodzą z próby losowej i gdy dana zmienna jest zmienną kategoryczną. Zmienna kategoryczna to taka, która składa się z selekcji takich jak typ samochodu, rasa, wykształcenie, mężczyzna vs kobieta, jak bardzo ktoś lubi kandydata politycznego (od bardzo do bardzo małego) itp.

Tego typu dane są często gromadzone za pośrednictwem odpowiedzi ankietowych lub kwestionariuszy. Dlatego analiza chi-kwadrat jest często najbardziej użyteczna w analizie tego typu danych.

Przegląd najważniejszych wydarzeń

  • χ2 zależy od wielkości różnicy między wartościami rzeczywistymi i obserwowanymi, stopni swobody i wielkości próbki.

  • Statystyka chi-kwadrat (χ2) ^^ jest miarą różnicy między obserwowanymi a oczekiwanymi częstościami wyników zbioru zdarzeń lub zmiennych.

  • Chi-kwadrat jest przydatny do analizy takich różnic w zmiennych kategorycznych, zwłaszcza tych o charakterze nominalnym.

  • Może być również używany do testowania zgodności między obserwowanym rozkładem a teoretycznym rozkładem częstotliwości.

  • χ2 może być użyte do sprawdzenia, czy dwie zmienne są ze sobą powiązane lub niezależne od siebie.

FAQ

Czy analiza chi-kwadrat jest używana, gdy zmienna niezależna jest nominalna czy porządkowa?

Zmienna nominalna to zmienna kategorialna, która różni się jakością, ale której kolejność liczbowa może być nieistotna. Na przykład poproszenie kogoś o jego ulubiony kolor dałoby zmienną nominalną. Z drugiej strony pytanie o wiek dałoby uporządkowany zestaw danych. Chi-kwadrat najlepiej zastosować do danych nominalnych.

Kto korzysta z analizy chi-kwadrat?

Ponieważ chi-kwadrat odnosi się do zmiennych kategorycznych, jest najczęściej używany przez badaczy, którzy badają dane z odpowiedzi ankietowych. Ten rodzaj badań może obejmować od demografii, badania konsumenckie i marketingowe, po nauki polityczne i ekonomię.

Do czego służy test chi-kwadrat?

Chi-kwadrat to test statystyczny używany do badania różnic między zmiennymi kategorialnymi z próby losowej w celu oceny zgodności między wynikami oczekiwanymi i obserwowanymi.