Investor's wiki

Chi-Quadrat (χ2) Statistik

Chi-Quadrat (χ2) Statistik

Was ist eine Chi-Quadrat-Statistik?

Eine Chi-Quadrat-Statistik (χ2) ^^ ist ein Test, der misst, wie ein Modell im Vergleich zu tatsächlich beobachteten Daten abschneidet. Die Daten, die zur Berechnung einer Chi-Quadrat- Statistik verwendet werden, müssen zufällig, roh sein, sich gegenseitig ausschließen,. aus unabhängigen Variablen stammen und aus einer ausreichend großen Stichprobe stammen. Beispielsweise erfüllen die Ergebnisse des Werfens einer fairen Münze diese Kriterien.

Chi-Quadrat-Tests werden häufig beim Testen von Hypothesen verwendet. Die Chi-Quadrat-Statistik vergleicht die Größe aller Diskrepanzen zwischen den erwarteten Ergebnissen und den tatsächlichen Ergebnissen unter Berücksichtigung der Stichprobengröße und der Anzahl der Variablen in der Beziehung.

Für diese Tests werden Freiheitsgrade verwendet, um zu bestimmen, ob eine bestimmte Nullhypothese basierend auf der Gesamtzahl von Variablen und Stichproben innerhalb des Experiments abgelehnt werden kann. Wie bei jeder Statistik gilt: Je größer der Stichprobenumfang, desto zuverlässiger die Ergebnisse.

Die Formel für Chi-Quadrat ist

χc2 =(O iEi)2Ei</ mfrac></ mtd>wobei: c=FreiheitsgradeO=Beobachtete(r) Wert(e)E=Erwartete(r) Wert(e)\begin&\chi^2_c = \sum \frac{(O_i - E_i )^2} \&\textbf\&c=\text\&O=\text{Beobachtete(r) Wert(e)}\&E =\text{Erwarteter Wert(e)}\end

Was sagt Ihnen eine Chi-Quadrat-Statistik?

Es gibt zwei Hauptarten von Chi-Quadrat-Tests: den Unabhängigkeitstest, der eine Beziehungsfrage stellt, wie z. B. „Gibt es einen Zusammenhang zwischen dem Geschlecht der Schüler und der Studienwahl?“; und der Anpassungstest,. der etwa fragt: "Wie gut passt die Münze in meiner Hand zu einer theoretisch fairen Münze?"

Die Chi-Quadrat-Analyse wird auf kategoriale Variablen angewendet und ist besonders nützlich, wenn diese Variablen nominal sind (wobei die Reihenfolge keine Rolle spielt, wie z. B. Familienstand oder Geschlecht).

Unabhängigkeit

Bei der Berücksichtigung des Geschlechts und der Kurswahl der Schüler könnte ein χ2-Test auf Unabhängigkeit verwendet werden. Um diesen Test durchzuführen, würde der Forscher Daten zu den beiden ausgewählten Variablen (Geschlecht und gewählte Kurse) sammeln und dann die Häufigkeit vergleichen, mit der männliche und weibliche Studenten unter den angebotenen Kursen auswählen, unter Verwendung der oben angegebenen Formel und eines χ^ 2^ Statistische Tabelle.

Besteht kein Zusammenhang zwischen Geschlecht und Studienwahl (d.h. wenn sie unabhängig voneinander sind), dann ist davon auszugehen, dass die tatsächlichen Häufigkeiten, mit denen männliche und weibliche Studierende jeden angebotenen Studiengang wählen, etwa gleich hoch sind oder umgekehrt der Anteil von männlichen und Studentinnen in jedem ausgewählten Kurs sollten ungefähr gleich dem Anteil der männlichen und weiblichen Studenten in der Stichprobe sein.

Ein χ2-Test auf Unabhängigkeit kann uns Aufschluss darüber geben, wie wahrscheinlich es ist, dass der Zufall jeden beobachteten Unterschied zwischen den tatsächlichen Häufigkeiten in den Daten und diesen theoretischen Erwartungen erklären kann.

Güte der Anpassung

χ2 bietet eine Möglichkeit zu testen, wie gut eine Datenstichprobe mit den (bekannten oder angenommenen) Merkmalen der größeren Population übereinstimmt, die die Stichprobe darstellen soll. Dies wird als Anpassungsgüte bezeichnet. Wenn die Stichprobendaten nicht zu den erwarteten Eigenschaften der Population passen, an der wir interessiert sind, möchten wir diese Stichprobe nicht verwenden, um Rückschlüsse auf die größere Population zu ziehen.

Beispiel

Betrachten Sie zum Beispiel eine imaginäre Münze mit einer genau 50/50-Chance, Kopf oder Zahl zu landen, und eine echte Münze, die Sie 100 Mal werfen. Wenn diese Münze fair ist, hat sie auch die gleiche Wahrscheinlichkeit, auf beiden Seiten zu landen, und das erwartete Ergebnis des 100-maligen Werfens der Münze ist, dass 50 Mal Kopf und 50 Mal Zahl fallen.

In diesem Fall kann uns χ2 sagen, wie gut die tatsächlichen Ergebnisse von 100 Münzwürfen im Vergleich zum theoretischen Modell sind, dass eine faire Münze 50/50 Ergebnisse liefert. Der tatsächliche Wurf könnte 50/50 oder 60/40 oder sogar 90/10 betragen. Je weiter die tatsächlichen Ergebnisse der 100 Würfe von 50/50 entfernt sind, desto weniger gut passt diese Reihe von Würfen zu der theoretischen Erwartung von 50/50, und desto wahrscheinlicher könnten wir schlussfolgern, dass diese Münze nicht wirklich a ist faire Münze.

Wann man einen Chi-Quadrat-Test verwenden sollte

Ein Chi-Quadrat-Test wird verwendet, um festzustellen, ob die beobachteten Ergebnisse mit den erwarteten Ergebnissen übereinstimmen, und um auszuschließen, dass die Beobachtungen auf Zufall zurückzuführen sind. Ein Chi-Quadrat-Test ist hierfür geeignet, wenn die zu analysierenden Daten aus einer Zufallsstichprobe stammen und es sich bei der betreffenden Variable um eine kategoriale Variable handelt. Eine kategoriale Variable besteht aus Auswahlen wie Autotyp, Rasse, Bildungsgrad, männlich vs. weiblich, wie sehr jemand einen politischen Kandidaten mag (von sehr bis sehr wenig) usw.

Diese Arten von Daten werden häufig über Umfrageantworten oder Fragebögen erhoben. Daher ist die Chi-Quadrat-Analyse oft am nützlichsten bei der Analyse dieser Art von Daten.

Höhepunkte

  • χ2 hängt von der Größe der Differenz zwischen tatsächlichen und beobachteten Werten, den Freiheitsgraden und der Stichprobengröße ab.

  • Eine Chi-Quadrat-Statistik (χ2) ^^ ist ein Maß für die Differenz zwischen den beobachteten und erwarteten Häufigkeiten der Ergebnisse einer Reihe von Ereignissen oder Variablen.

  • Chi-Quadrat ist nützlich, um solche Unterschiede in kategorialen Variablen zu analysieren, insbesondere in nominaler Natur.

  • Es kann auch verwendet werden, um die Anpassungsgüte zwischen einer beobachteten Verteilung und einer theoretischen Häufigkeitsverteilung zu testen.

  • χ2 kann verwendet werden, um zu testen, ob zwei Variablen verwandt oder unabhängig voneinander sind.

FAQ

Wird die Chi-Quadrat-Analyse verwendet, wenn die unabhängige Variable nominal oder ordinal ist?

Eine nominale Variable ist eine kategoriale Variable, die sich durch Qualität unterscheidet, deren numerische Reihenfolge jedoch irrelevant sein kann. Wenn Sie beispielsweise jemanden nach seiner Lieblingsfarbe fragen, würde dies eine nominale Variable ergeben. Die Frage nach dem Alter einer Person hingegen würde einen ordinalen Datensatz ergeben. Chi-Quadrat lässt sich am besten auf Nominaldaten anwenden.

Wer verwendet die Chi-Quadrat-Analyse?

Da Chi-Quadrat für kategoriale Variablen gilt, wird es am häufigsten von Forschern verwendet, die Antwortdaten aus Umfragen untersuchen. Diese Art der Forschung kann von Demographie über Verbraucher- und Marketingforschung bis hin zu Politikwissenschaft und Ökonomie reichen.

Wofür wird ein Chi-Quadrat-Test verwendet?

Chi-Quadrat ist ein statistischer Test, der verwendet wird, um die Unterschiede zwischen kategorialen Variablen aus einer Zufallsstichprobe zu untersuchen, um die Anpassungsgüte zwischen erwarteten und beobachteten Ergebnissen zu beurteilen.