Güte der Anpassung
Was ist Anpassungsgüte?
Der Begriff Anpassungsgüte bezieht sich auf einen statistischen Test, der bestimmt, wie gut Stichprobendaten zu einer Verteilung aus einer Grundgesamtheit mit einer Normalverteilung passen. Einfach gesagt, es wird die Hypothese aufgestellt, ob eine Stichprobe verzerrt ist oder die Daten darstellt, die Sie in der tatsächlichen Grundgesamtheit erwarten würden.
Die Anpassungsgüte stellt die Diskrepanz zwischen den beobachteten Werten und den vom Modell erwarteten Werten in einem Normalverteilungsfall fest. Es gibt mehrere Methoden zur Bestimmung der Anpassungsgüte, einschließlich des Chi-Quadrats.
Goodness-of-Fit verstehen
Anpassungstests sind statistische Methoden, die Rückschlüsse auf beobachtete Werte ziehen. Sie können beispielsweise feststellen, ob eine Stichprobengruppe wirklich repräsentativ für die gesamte Bevölkerung ist. Als solche bestimmen sie, wie tatsächliche Werte mit den vorhergesagten Werten in einem Modell in Beziehung stehen. Bei der Entscheidungsfindung erleichtern Anpassungstests die Vorhersage von Trends und Mustern in der Zukunft.
Wie oben erwähnt, gibt es mehrere Arten von Anpassungstests. Dazu gehören der Chi-Quadrat-Test, der am weitesten verbreitet ist, sowie der Kolmogorov-Smirnov-Test und der Shipiro-Wilk-Test. Die Tests werden normalerweise unter Verwendung von Computersoftware durchgeführt. Statistiker können diese Tests jedoch mit Formeln durchführen, die auf die jeweilige Testart zugeschnitten sind.
Um den Test durchzuführen, benötigen Sie eine bestimmte Variable sowie eine Annahme darüber, wie sie verteilt ist. Sie benötigen auch einen Datensatz mit klaren und eindeutigen Werten, wie zum Beispiel:
Die beobachteten Werte, die aus dem tatsächlichen Datensatz abgeleitet werden
Die Erwartungswerte, die den getroffenen Annahmen entnommen werden
Die Gesamtzahl der Kategorien im Satz
Anpassungstests werden häufig verwendet, um die Normalität von Residuen zu testen oder um zu bestimmen, ob zwei Stichproben aus identischen Verteilungen stammen.
Besondere Überlegungen
Um einen Anpassungstest zu interpretieren, ist es für Statistiker wichtig, ein Alpha-Niveau festzulegen, wie z. B. den p-Wert für den Chi-Quadrat-Test. Der p-Wert bezieht sich auf die Wahrscheinlichkeit, Ergebnisse nahe den Extremen der beobachteten Ergebnisse zu erhalten. Dies setzt voraus, dass die Nullhypothese richtig ist. Eine Nullhypothese behauptet, dass keine Beziehung zwischen Variablen besteht, und die Alternativhypothese geht davon aus, dass eine Beziehung besteht.
Stattdessen wird die Häufigkeit der beobachteten Werte gemessen und anschließend mit den erwarteten Werten und den Freiheitsgraden zur Berechnung des Chi-Quadrats verwendet. Wenn das Ergebnis kleiner als Alpha ist, ist die Nullhypothese ungültig, was darauf hindeutet, dass eine Beziehung zwischen den Variablen besteht.
Arten von Anpassungstests
Chi-Quadrat-Test
Der Chi-Quadrat-Test,. der auch als Chi-Quadrat-Test auf Unabhängigkeit bekannt ist, ist eine Methode der Inferenzstatistik, die die Gültigkeit einer Aussage über eine Population anhand einer Zufallsstichprobe testet.
Wird ausschließlich für Daten verwendet, die in Klassen (Bins) unterteilt sind, und erfordert eine ausreichende Stichprobengröße, um genaue Ergebnisse zu erzielen. Aber es zeigt nicht die Art oder Intensität der Beziehung an. Zum Beispiel schließt es nicht, ob die Beziehung positiv oder negativ ist.
Um eine Chi-Quadrat-Anpassungsgüte zu berechnen, legen Sie das gewünschte Alpha-Signifikanzniveau fest. Wenn Ihr Konfidenzniveau also 95 % (oder 0,95) beträgt, dann ist das Alpha 0,05. Identifizieren Sie als Nächstes die zu testenden kategorialen Variablen und definieren Sie dann Hypothesenaussagen über die Beziehungen zwischen ihnen.
Variablen müssen sich gegenseitig ausschließen, um sich für den Chi-Quadrat-Test auf Unabhängigkeit zu qualifizieren. Und der Chi-Anpassungstest sollte nicht für kontinuierliche Daten verwendet werden.
Kolmogorov-Smirnov-Test
< span class="mspace" style="margin-right:0.16666666666666666em;">(F(Y i</ span>)<span-Klasse ="mspace" style="margin-right:0.2222222222222222em;">−<span-Klasse ="mord">< span class="vlist" style="height:0.855664em;">< span class="sizing reset-size6 size3 mtight">Ni−1 ,< span style="top:-2.6550000000000002em;">Ni−<span-Klasse ="base">F( Yi< /span>))
Der nach den russischen Mathematikern Andrey Kolmogorov und Nikolai Smirnov benannte Kolmogorov-Smirnov-Test (auch bekannt als KS-Test) ist eine statistische Methode, die bestimmt, ob eine Stichprobe aus einer bestimmten Verteilung innerhalb einer Population stammt.
Stichproben (z. B. über 2000) empfohlen wird , ist nicht parametrisch. Das heißt, es ist nicht auf eine Verteilung angewiesen, um gültig zu sein. Das Ziel ist es, die Nullhypothese zu beweisen, die die Stichprobe der Normalverteilung ist.
Wie Chi-Quadrat verwendet es eine Null- und Alternativhypothese und ein Alpha-Signifikanzniveau. Null gibt an, dass die Daten einer bestimmten Verteilung innerhalb der Population folgen, und Alternative gibt an, dass die Daten keiner bestimmten Verteilung innerhalb der Population folgten. Das Alpha wird verwendet, um den im Test verwendeten kritischen Wert zu bestimmen. Im Gegensatz zum Chi-Quadrat-Test gilt der Kolmogorov-Smirnov-Test jedoch für stetige Verteilungen.
Die berechnete Teststatistik wird oft mit D bezeichnet. Sie bestimmt, ob die Nullhypothese akzeptiert oder verworfen wird. Wenn D größer als der kritische Wert bei Alpha ist, wird die Nullhypothese verworfen. Wenn D kleiner als der kritische Wert ist, wird die Nullhypothese akzeptiert.
Shipiro-Wilk-Test
< span class="mord">∑i=1n< /span>(</ span>x< /span>i − x<span-Klasse ="mord mtight">ˉ) 2 (∑ i =1n a< span class="vlist" style="height:0.3280857142857143em;">i< /span>< span>(< span class="mord mathnormal mtight">x(i ) )2,
Der Shipiro-Wilk-Test bestimmt, ob eine Stichprobe einer Normalverteilung folgt. Der Test prüft nur auf Normalität, wenn eine Stichprobe mit einer Variable kontinuierlicher Daten verwendet wird, und wird für kleine Stichprobenumfänge bis zu 2000 empfohlen.
Der Shipiro-Wilk-Test verwendet ein Wahrscheinlichkeitsdiagramm namens QQ-Plot, das zwei Sätze von Quantilen auf der y-Achse anzeigt, die vom kleinsten zum größten angeordnet sind. Wenn jedes Quantil aus derselben Verteilung stammt, sind die Diagrammreihen linear.
Das QQ-Diagramm wird verwendet, um die Varianz zu schätzen. Unter Verwendung der QQ-Plot-Varianz zusammen mit der geschätzten Varianz der Grundgesamtheit kann man bestimmen, ob die Stichprobe zu einer Normalverteilung gehört. Ist der Quotient beider Varianzen gleich oder nahe bei 1, kann die Nullhypothese angenommen werden. Wenn er deutlich kleiner als 1 ist, kann er verworfen werden.
Genau wie die oben erwähnten Tests verwendet dieser Alpha und bildet zwei Hypothesen: Null und Alternative. Die Nullhypothese besagt, dass die Stichprobe aus der Normalverteilung stammt, während die Alternativhypothese besagt, dass die Stichprobe nicht aus der Normalverteilung stammt.
Goodness-of-Fit-Beispiel
Hier ist ein hypothetisches Beispiel, um zu zeigen, wie der Anpassungstest funktioniert.
Angenommen, ein kleines Gemeinschafts-Fitnessstudio arbeitet unter der Annahme, dass die meisten Besucher montags, dienstags und samstags, die durchschnittliche Besucherzahl mittwochs und donnerstags und die niedrigste Besucherzahl freitags und sonntags stattfindet. Basierend auf diesen Annahmen beschäftigt das Fitnessstudio jeden Tag eine bestimmte Anzahl von Mitarbeitern, um Mitglieder einzuchecken, Einrichtungen zu reinigen, Trainingsdienste anzubieten und Kurse zu unterrichten.
Aber das Fitnessstudio läuft finanziell nicht gut und der Besitzer möchte wissen, ob diese Annahmen zur Anwesenheit und der Personalbestand korrekt sind. Der Eigentümer beschließt, sechs Wochen lang jeden Tag die Anzahl der Fitnessstudiobesucher zu zählen. Sie können dann die angenommene Anwesenheit des Fitnessstudios mit der beobachteten Anwesenheit vergleichen, indem sie zum Beispiel einen Chi-Quadrat-Anpassungstest verwenden.
Jetzt, da sie die neuen Daten haben, können sie bestimmen, wie sie das Fitnessstudio am besten verwalten und die Rentabilität verbessern können.
Das Endergebnis
Anpassungstests bestimmen, wie gut Stichprobendaten zu den Erwartungen einer Grundgesamtheit passen. Aus den Stichprobendaten wird ein beobachteter Wert gesammelt und unter Verwendung eines Diskrepanzmaßes mit dem berechneten erwarteten Wert verglichen. Je nachdem, welches Ergebnis Sie anstreben, stehen verschiedene Hypothesentests zur Anpassungsgüte zur Verfügung.
Die Wahl des richtigen Anpassungstests hängt weitgehend davon ab, was Sie über eine Stichprobe wissen möchten und wie groß die Stichprobe ist. Wenn Sie beispielsweise wissen möchten, ob beobachtete Werte für kategoriale Daten mit den erwarteten Werten für kategoriale Daten übereinstimmen, verwenden Sie Chi-Quadrat. Wenn Sie wissen möchten, ob eine kleine Stichprobe einer Normalverteilung folgt, könnte der Shipiro-Wilk-Test vorteilhaft sein. Es gibt viele Tests zur Bestimmung der Anpassungsgüte.
Höhepunkte
Eine Anpassungsgüte ist ein statistischer Test, der zu bestimmen versucht, ob ein Satz von beobachteten Werten mit den unter dem anwendbaren Modell erwarteten Werten übereinstimmt.
Sie können Ihnen zeigen, ob Ihre Stichprobendaten zu einem erwarteten Datensatz aus einer Grundgesamtheit mit Normalverteilung passen.
Der Chi-Quadrat-Test bestimmt, ob eine Beziehung zwischen kategorialen Daten besteht.
Es gibt mehrere Arten von Anpassungstests, aber der häufigste ist der Chi-Quadrat-Test.
Der Kolmogorov-Smirnov-Test bestimmt, ob eine Stichprobe aus einer bestimmten Verteilung einer Grundgesamtheit stammt.
FAQ
Was ist die Anpassungsgüte beim Chi-Quadrat-Test?
Der Chi-Quadrat-Test, ob Beziehungen zwischen kategorialen Variablen bestehen und ob die Stichprobe das Ganze darstellt. Es schätzt, wie genau die beobachteten Daten die erwarteten Daten widerspiegeln oder wie gut sie passen.
Was bedeutet Anpassungsgüte?
Goodness-of-Fit ist ein statistischer Hypothesentest, der verwendet wird, um zu sehen, wie genau beobachtete Daten erwartete Daten widerspiegeln. Goodness-of-Fit-Tests können dabei helfen festzustellen, ob eine Stichprobe einer Normalverteilung folgt, ob kategoriale Variablen verwandt sind oder ob Zufallsstichproben aus derselben Verteilung stammen.
Wie wird der Anpassungstest durchgeführt?
Der Goodness-of-FIt-Test besteht aus verschiedenen Testmethoden. Das Ziel des Tests hilft bei der Bestimmung der zu verwendenden Methode. Wenn beispielsweise das Ziel darin besteht, die Normalität an einer relativ kleinen Stichprobe zu testen, kann der Shipiro-Wilk-Test geeignet sein. Wenn Sie feststellen möchten, ob eine Stichprobe aus einer bestimmten Verteilung innerhalb einer Population stammt, wird der Kolmogorov-Smirnov-Test verwendet. Jeder Test verwendet seine eigene einzigartige Formel. Sie haben jedoch Gemeinsamkeiten, wie z. B. eine Nullhypothese und ein Signifikanzniveau.
Warum ist Anpassungsgüte wichtig?
Goodness-of-Fit-Tests helfen festzustellen, ob die beobachteten Daten mit den Erwartungen übereinstimmen. Entscheidungen können basierend auf dem Ergebnis des durchgeführten Hypothesentests getroffen werden. Ein Einzelhändler möchte beispielsweise wissen, welches Produktangebot junge Menschen anspricht. Der Einzelhändler befragt stichprobenartig alte und junge Menschen, um herauszufinden, welches Produkt bevorzugt wird. Mithilfe von Chi-Quadrat stellen sie fest, dass mit 95 %iger Sicherheit eine Beziehung zwischen Produkt A und jungen Menschen besteht. Basierend auf diesen Ergebnissen konnte festgestellt werden, dass diese Stichprobe die Population junger Erwachsener repräsentiert. Einzelhandelsvermarkter können dies nutzen, um ihre Kampagnen zu reformieren.