Stichprobenverteilung
Was ist eine Stichprobenverteilung?
Eine Stichprobenverteilung ist eine Wahrscheinlichkeitsverteilung einer Statistik, die aus einer größeren Anzahl von Stichproben aus einer bestimmten Grundgesamtheit gewonnen wird. Die Stichprobenverteilung einer bestimmten Grundgesamtheit ist die Häufigkeitsverteilung einer Reihe unterschiedlicher Ergebnisse, die möglicherweise für eine Statistik einer Grundgesamtheit auftreten könnten.
In der Statistik ist eine Grundgesamtheit der gesamte Pool, aus dem eine statistische Stichprobe gezogen wird. Eine Population kann sich auf eine ganze Gruppe von Personen, Objekten, Ereignissen, Krankenhausbesuchen oder Messungen beziehen. Eine Population kann somit als eine aggregierte Beobachtung von Subjekten bezeichnet werden, die durch ein gemeinsames Merkmal gruppiert sind.
- Eine Stichprobenverteilung ist eine Statistik, die durch wiederholte Stichproben aus einer größeren Grundgesamtheit gewonnen wird.
- Es beschreibt eine Reihe möglicher Ergebnisse einer Statistik, wie z. B. den Mittelwert oder Modus einer Variablen, da es sich tatsächlich um eine Population handelt.
- Die Mehrzahl der von Forschern analysierten Daten stammen tatsächlich aus Stichproben und nicht aus Populationen.
Stichprobenverteilung verstehen
Viele Daten, die von Akademikern, Statistikern, Forschern, Vermarktern, Analysten usw. gezogen und verwendet werden, sind tatsächlich Stichproben, keine Populationen. Eine Stichprobe ist eine Teilmenge einer Grundgesamtheit. Beispielsweise kann ein medizinischer Forscher, der das durchschnittliche Gewicht aller in Nordamerika von 1995 bis 2005 geborenen Babys mit denen vergleichen wollte, die im selben Zeitraum in Südamerika geboren wurden, nicht innerhalb eines angemessenen Zeitraums die Daten für die gesamte Bevölkerung von ziehen über eine Million Geburten, die über einen Zeitraum von zehn Jahren stattfanden. Sie werden stattdessen nur das Gewicht von beispielsweise 100 Babys auf jedem Kontinent verwenden, um eine Schlussfolgerung zu ziehen. Das verwendete Gewicht von 200 Babys ist die Stichprobe und das berechnete Durchschnittsgewicht ist der Stichprobenmittelwert.
Nehmen wir nun an, dass der medizinische Forscher, anstatt nur eine Stichprobe von 100 Neugeborenengewichten von jedem Kontinent zu nehmen, wiederholt Zufallsstichproben aus der Allgemeinbevölkerung nimmt und den Stichprobenmittelwert für jede Stichprobengruppe berechnet. Für Nordamerika ziehen sie also Daten für 100 in den USA, Kanada und Mexiko aufgezeichnete Gewichte von Neugeborenen wie folgt heran: vier 100-Proben aus ausgewählten Krankenhäusern in den USA, fünf 70-Proben aus Kanada und drei 150-Datensätze aus Mexiko, insgesamt von 1.200 Gewichten von Neugeborenen, gruppiert in 12 Sets. Sie sammeln auch Stichprobendaten von 100 Geburtsgewichten aus jedem der 12 Länder in Südamerika.
Jede Stichprobe hat ihren eigenen Stichprobenmittelwert und die Verteilung der Stichprobenmittelwerte wird als Stichprobenverteilung bezeichnet.
Das für jeden Stichprobensatz berechnete durchschnittliche Gewicht ist die Stichprobenverteilung des Mittelwerts. Aus einer Stichprobe kann nicht nur der Mittelwert berechnet werden. Andere Statistiken wie Standardabweichung, Varianz, Anteil und Bereich können aus Beispieldaten berechnet werden. Die Standardabweichung und die Varianz messen die Variabilität der Stichprobenverteilung.
Die Anzahl der Beobachtungen in einer Grundgesamtheit, die Anzahl der Beobachtungen in einer Stichprobe und das zum Ziehen der Stichprobensätze verwendete Verfahren bestimmen die Variabilität einer Stichprobenverteilung. Die Standardabweichung einer Stichprobenverteilung wird als Standardfehler bezeichnet. Während der Mittelwert einer Stichprobenverteilung gleich dem Mittelwert der Grundgesamtheit ist, hängt der Standardfehler von der Standardabweichung der Grundgesamtheit, der Größe der Grundgesamtheit und der Größe der Stichprobe ab.
Wenn Sie wissen, wie weit der Mittelwert der einzelnen Stichprobensätze voneinander und vom Mittelwert der Grundgesamtheit entfernt ist, erhalten Sie einen Hinweis darauf, wie nahe der Mittelwert der Stichprobe am Mittelwert der Grundgesamtheit liegt. Der Standardfehler der Stichprobenverteilung nimmt mit zunehmendem Stichprobenumfang ab.
Besondere Überlegungen
Eine Grundgesamtheit oder ein Stichprobensatz von Zahlen hat eine Normalverteilung. Da eine Stichprobenverteilung jedoch mehrere Sätze von Beobachtungen enthält, muss sie nicht unbedingt glockenförmig sein.
Nach unserem Beispiel weist das Bevölkerungsdurchschnittsgewicht von Babys in Nordamerika und Südamerika eine Normalverteilung auf, da einige Babys untergewichtig (unter dem Mittelwert) oder übergewichtig (über dem Mittelwert) sind, wobei die meisten Babys dazwischen liegen (um den Mittelwert herum). ). Wenn das durchschnittliche Gewicht von Neugeborenen in Nordamerika 7 Pfund beträgt, wird das durchschnittliche Stichprobengewicht in jedem der 12 Sätze von Stichprobenbeobachtungen, die für Nordamerika aufgezeichnet wurden, ebenfalls nahe bei 7 Pfund liegen.
Wenn Sie jedoch jeden der in jeder der 1.200 Stichprobengruppen berechneten Mittelwerte grafisch darstellen, kann die resultierende Form zu einer gleichmäßigen Verteilung führen, aber es ist schwierig, mit Sicherheit vorherzusagen, wie die tatsächliche Form aussehen wird. Je mehr Stichproben der Forscher aus der Population von über einer Million Gewichtsfiguren verwendet, desto mehr beginnt das Diagramm, eine Normalverteilung zu bilden.