Centralne Twierdzenie Graniczne (CLT)
Co to jest centralne twierdzenie graniczne (CLT)?
W teorii prawdopodobieństwa centralne twierdzenie graniczne (CLT) stwierdza, że rozkład zmiennej w próbie jest zbliżony do rozkładu normalnego (tj. „krzywej dzwonowej”) w miarę zwiększania się wielkości próby, zakładając, że wszystkie próbki są identyczne pod względem wielkości i niezależnie rzeczywistego kształtu rozmieszczenia populacji.
Innymi słowy, CLT jest przesłanką statystyczną,. że przy wystarczająco dużej wielkości próby z populacji o skończonym poziomie wariancji, średnia wszystkich próbkowanych zmiennych z tej samej populacji będzie w przybliżeniu równa średniej całej populacji. Co więcej, próbki te przybliżają rozkład normalny,. a ich wariancje są w przybliżeniu równe wariancji populacji wraz ze wzrostem wielkości próby, zgodnie z prawem dużych liczb.
Chociaż koncepcja ta została po raz pierwszy opracowana przez Abrahama de Moivre w 1733 r., została sformalizowana dopiero w 1930 r., kiedy znany węgierski matematyk George Pólya nazwał ją centralnym twierdzeniem granicznym.
Zrozumienie centralnego twierdzenia granicznego (CLT)
Zgodnie z centralnym twierdzeniem granicznym, średnia próbki danych będzie bliższa średniej całej badanej populacji w miarę wzrostu wielkości próby, niezależnie od rzeczywistego rozkładu danych. Innymi słowy, dane są dokładne, niezależnie od tego, czy rozkład jest normalny, czy nieprawidłowy.
Jako ogólną zasadę uważa się, że rozmiary próbek wynoszące około 30-50 są wystarczające do utrzymania CLT, co oznacza, że rozkład średnich próbek jest dość normalny. Dlatego im więcej próbek zostanie pobranych, tym bardziej wyniki na wykresie przyjmą kształt rozkładu normalnego. Należy jednak zauważyć, że centralne twierdzenie graniczne nadal będzie aproksymowane w wielu przypadkach dla znacznie mniejszych próbek, takich jak n=8 lub n=5.
Centralne twierdzenie graniczne jest często używane w połączeniu z prawem dużych liczb, które mówi, że średnia ze średnich z próby i odchyleń standardowych zbliży się do zrównania średniej populacji i odchylenia standardowego wraz ze wzrostem wielkości próby, co jest niezwykle przydatne w dokładne przewidywanie cech populacji.
Kluczowe elementy centralnego twierdzenia granicznego
Centralne twierdzenie graniczne składa się z kilku kluczowych cech. Te cechy w dużej mierze dotyczą prób, wielkości prób i populacji danych.
Próbkowanie odbywa się sukcesywnie. Oznacza to, że niektóre jednostki próbek są wspólne z jednostkami próbek wybranymi poprzednio.
Pobieranie próbek jest losowe. Wszystkie próbki muszą być wybierane losowo,. aby miały taką samą statystyczną możliwość doboru.
Próbki powinny być niezależne. Selekcje lub wyniki z jednej próbki nie powinny mieć wpływu na przyszłe próbki lub wyniki innych próbek.
Próbki powinny być ograniczone. Często mówi się, że próbka nie powinna stanowić więcej niż 10% populacji, jeśli pobieranie próbek odbywa się bez wymiany. Ogólnie rzecz biorąc, większe liczebności populacji uzasadniają użycie większych liczebności próby.
Wielkość próbki rośnie. Centralne twierdzenie graniczne jest istotne, gdy wybieranych jest więcej próbek.
Centralne twierdzenie graniczne w finansach
CLT jest przydatny podczas badania zwrotów z poszczególnych akcji lub szerszych indeksów, ponieważ analiza jest prosta ze względu na względną łatwość generowania niezbędnych danych finansowych. W związku z tym inwestorzy wszelkiego rodzaju polegają na CLT do analizy stóp zwrotu z akcji, konstruowania portfeli i zarządzania ryzykiem.
Załóżmy na przykład, że inwestor chce przeanalizować całkowity zwrot dla indeksu giełdowego, który obejmuje 1000 akcji. W tym scenariuszu inwestor może po prostu zbadać losową próbkę akcji, aby uzyskać szacunkowe zwroty z całkowitego indeksu. Aby zapewnić bezpieczeństwo, co najmniej 30–50 losowo wybranych stad z różnych sektorów powinno zostać poddanych próbie, aby utrzymać centralne twierdzenie graniczne. Co więcej, wcześniej wybrane akcje muszą zostać zastąpione innymi nazwami, aby wyeliminować stronniczość.
Przegląd najważniejszych wydarzeń
Centralne twierdzenie graniczne (CLT) stwierdza, że rozkład średnich próby jest zbliżony do rozkładu normalnego w miarę zwiększania się wielkości próby, niezależnie od rozkładu populacji.
Rozmiary próbek równe lub większe niż 30 są często uważane za wystarczające do utrzymania CLT.
Kluczowym aspektem CLT jest to, że średnia ze średnich z próby i odchyleń standardowych będzie równa średniej populacji i odchyleniu standardowemu.
Wystarczająco duża wielkość próby może dokładniej przewidywać charakterystykę populacji.
CLT jest przydatne w finansach podczas analizy dużej kolekcji papierów wartościowych w celu oszacowania dystrybucji portfela i cech pod kątem zwrotu, ryzyka i korelacji.
FAQ
Dlaczego centralne twierdzenie graniczne jest przydatne?
Centralne twierdzenie graniczne jest przydatne podczas analizy dużych zbiorów danych, ponieważ pozwala założyć, że rozkład próbkowania średniej będzie w większości przypadków rozkład normalny. Pozwala to na łatwiejszą analizę statystyczną i wnioskowanie. Na przykład inwestorzy mogą użyć centralnego twierdzenia granicznego do agregowania indywidualnych danych dotyczących wydajności zabezpieczeń i generowania rozkładu średnich próbek reprezentujących większy rozkład populacji dla zwrotów z zabezpieczeń w pewnym okresie czasu.
Jaki jest wzór na centralne twierdzenie graniczne?
Centralne twierdzenie graniczne nie ma własnego wzoru, ale opiera się na średniej próbki i odchyleniu standardowym. Gdy średnie próbki są zbierane z populacji, odchylenie standardowe jest używane do rozmieszczenia danych na krzywej rozkładu prawdopodobieństwa.
Dlaczego wielkość próbki minimalizowanej dla centralnego twierdzenia granicznego wynosi 30?
Próba o rozmiarze 30 jest dość powszechna we wszystkich statystykach. Próba o rozmiarze 30 często zwiększa przedział ufności zbioru danych o populacji na tyle, aby uzasadnić twierdzenia przeciwko Twoim odkryciom. Im wyższa wielkość próby, tym większe prawdopodobieństwo, że próbka będzie reprezentatywna dla zbioru populacji.