Zentraler Grenzwertsatz (CLT)
Was ist der zentrale Grenzwertsatz (CLT)?
In der Wahrscheinlichkeitstheorie besagt das Central Limit Theorem (CLT), dass sich die Verteilung einer Stichprobenvariablen einer Normalverteilung (dh einer „Glockenkurve“) annähert, wenn die Stichprobengröße größer wird, vorausgesetzt, dass alle Stichproben gleich groß sind, und unabhängig davon der tatsächlichen Verteilungsform der Population.
Anders ausgedrückt, CLT ist eine statistische Prämisse, dass bei einer ausreichend großen Stichprobengröße aus einer Grundgesamtheit mit einem endlichen Varianzniveau der Mittelwert aller Stichprobenvariablen aus derselben Grundgesamtheit ungefähr gleich dem Mittelwert der gesamten Grundgesamtheit ist. Darüber hinaus nähern sich diese Stichproben einer Normalverteilung an, wobei ihre Varianzen gemäß dem Gesetz der großen Zahlen mit zunehmender Stichprobengröße ungefähr gleich der Varianz e der Grundgesamtheit sind.
Obwohl dieses Konzept erstmals 1733 von Abraham de Moivre entwickelt wurde, wurde es erst 1930 formalisiert, als der bekannte ungarische Mathematiker George Pólya es den zentralen Grenzwertsatz nannte.
Den zentralen Grenzwertsatz (CLT) verstehen
Gemäß dem zentralen Grenzwertsatz liegt der Mittelwert einer Datenstichprobe mit zunehmender Stichprobengröße näher am Mittelwert der betreffenden Gesamtpopulation, ungeachtet der tatsächlichen Verteilung der Daten. Mit anderen Worten, die Daten sind genau, unabhängig davon, ob die Verteilung normal oder abweichend ist.
Als allgemeine Regel gelten Stichprobenumfänge von etwa 30–50 als ausreichend, damit die CLT Bestand hat, was bedeutet, dass die Verteilung der Stichprobenmittel ziemlich normalverteilt ist. Je mehr Stichproben genommen werden, desto mehr nehmen die graphisch dargestellten Ergebnisse die Form einer Normalverteilung an. Beachten Sie jedoch, dass der zentrale Grenzwertsatz in vielen Fällen für viel kleinere Stichprobenumfänge, wie z. B. n = 8 oder n = 5, immer noch angenähert wird.
Der zentrale Grenzwertsatz wird häufig in Verbindung mit dem Gesetz der großen Zahlen verwendet, das besagt, dass der Durchschnitt der Mittelwerte und Standardabweichungen der Stichprobe mit zunehmender Stichprobengröße näher an den Mittelwert und die Standardabweichung der Grundgesamtheit herankommt, was äußerst nützlich ist genaue Vorhersage der Charakteristika von Populationen.
Schlüsselkomponenten des zentralen Grenzwertsatzes
Der zentrale Grenzwertsatz besteht aus mehreren Schlüsselmerkmalen. Diese Merkmale drehen sich hauptsächlich um Stichproben, Stichprobenumfänge und die Datenpopulation.
Die Stichprobenziehung erfolgt sukzessive. Dies bedeutet, dass einige Stichprobeneinheiten mit Stichprobeneinheiten übereinstimmen, die bei früheren Gelegenheiten ausgewählt wurden.
Die Stichprobenziehung erfolgt nach dem Zufallsprinzip. Alle Stichproben müssen nach dem Zufallsprinzip ausgewählt werden, damit sie die gleiche statistische Auswahlmöglichkeit haben.
Proben sollten unabhängig sein. Die Auswahlen oder Ergebnisse aus einer Probe sollten keinen Einfluss auf zukünftige Proben oder andere Probenergebnisse haben.
Die Stichproben sollten begrenzt werden. Es wird oft zitiert, dass eine Stichprobe nicht mehr als 10 % einer Grundgesamtheit ausmachen sollte, wenn die Stichprobennahme ohne Ersatz erfolgt. Im Allgemeinen rechtfertigen größere Populationsgrößen die Verwendung größerer Stichprobenumfänge.
Die Stichprobengröße nimmt zu. Der zentrale Grenzwertsatz ist relevant, wenn mehr Stichproben ausgewählt werden.
Der zentrale Grenzwertsatz im Finanzwesen
Der CLT ist nützlich, wenn die Renditen einer einzelnen Aktie oder breiterer Indizes untersucht werden, da die Analyse aufgrund der relativ einfachen Generierung der erforderlichen Finanzdaten einfach ist. Folglich verlassen sich Anleger aller Art auf CLT, um Aktienrenditen zu analysieren, Portfolios aufzubauen und Risiken zu verwalten.
Angenommen, ein Investor möchte die Gesamtrendite für einen Aktienindex analysieren, der 1.000 Aktien umfasst. In diesem Szenario kann dieser Anleger einfach eine zufällige Stichprobe von Aktien untersuchen, um geschätzte Renditen des Gesamtindex zu ermitteln. Sicherheitshalber sollten mindestens 30-50 zufällig ausgewählte Aktien aus verschiedenen Sektoren als Stichproben genommen werden, damit der zentrale Grenzwertsatz gilt. Darüber hinaus müssen zuvor ausgewählte Aktien gegen andere Namen ausgetauscht werden, um Verzerrungen zu beseitigen.
Höhepunkte
Der zentrale Grenzwertsatz (CLT) besagt, dass die Verteilung der Stichprobenmittelwerte sich einer Normalverteilung annähert, wenn die Stichprobengröße größer wird, unabhängig von der Verteilung der Grundgesamtheit.
Stichprobenumfänge gleich oder größer als 30 werden oft als ausreichend angesehen, damit der CLT Bestand hat.
Ein Schlüsselaspekt von CLT ist, dass der Durchschnitt der Mittelwerte und Standardabweichungen der Stichprobe dem Mittelwert und der Standardabweichung der Grundgesamtheit entspricht.
Eine ausreichend große Stichprobengröße kann die Eigenschaften einer Population genauer vorhersagen.
CLT ist im Finanzwesen nützlich, wenn eine große Sammlung von Wertpapieren analysiert wird, um Portfolioverteilungen und Merkmale für Renditen, Risiken und Korrelationen zu schätzen.
FAQ
Warum ist der zentrale Grenzwertsatz nützlich?
Der zentrale Grenzwertsatz ist bei der Analyse großer Datensätze nützlich, da er die Annahme zulässt, dass die Stichprobenverteilung des Mittelwerts in den meisten Fällen normalverteilt ist. Dies ermöglicht eine einfachere statistische Analyse und Schlussfolgerung. Beispielsweise können Anleger das zentrale Limittheorem verwenden, um einzelne Wertpapierleistungsdaten zu aggregieren und eine Verteilung von Stichprobenmittelwerten zu generieren, die eine größere Grundgesamtheitsverteilung für Wertpapierrenditen über einen bestimmten Zeitraum darstellen.
Wie lautet die Formel für den zentralen Grenzwertsatz?
Der zentrale Grenzwertsatz hat keine eigene Formel, aber er stützt sich auf den Stichprobenmittelwert und die Standardabweichung. Da Stichprobenmittelwerte aus der Grundgesamtheit gesammelt werden, wird die Standardabweichung verwendet, um die Daten über eine Wahrscheinlichkeitsverteilungskurve zu verteilen.
Warum ist die minimale Stichprobengröße des zentralen Grenzwertsatzes 30?
Eine Stichprobengröße von 30 ist in Statistiken ziemlich üblich. Eine Stichprobengröße von 30 erhöht häufig das Konfidenzintervall Ihres Populationsdatensatzes ausreichend, um Behauptungen gegen Ihre Ergebnisse zu rechtfertigen. Je höher Ihre Stichprobengröße ist, desto wahrscheinlicher ist die Stichprobe repräsentativ für Ihre Grundgesamtheit.