Dystrybucja próbek
Co to jest dystrybucja pr贸bkowania?
Rozk艂ad pr贸bkowania to rozk艂ad prawdopodobie艅stwa statystyki uzyskanej z wi臋kszej liczby pr贸bek pobranych z okre艣lonej populacji. Rozk艂ad pr贸bkowania danej populacji to rozk艂ad cz臋sto艣ci szeregu r贸偶nych wynik贸w, kt贸re mog膮 ewentualnie wyst膮pi膰 dla statystyki populacji.
W statystykach populacja to ca艂a pula, z kt贸rej pobierana jest pr贸ba statystyczna. Populacja mo偶e odnosi膰 si臋 do ca艂ej grupy os贸b, obiekt贸w, wydarze艅, wizyt w szpitalu lub pomiar贸w. Mo偶na zatem powiedzie膰, 偶e populacja jest zbiorcz膮 obserwacj膮 osobnik贸w zgrupowanych wed艂ug wsp贸lnej cechy.
- Rozk艂ad pr贸bkowania to statystyka, kt贸ra jest uzyskiwana poprzez powtarzane pr贸bkowanie z wi臋kszej populacji.
- Opisuje zakres mo偶liwych wynik贸w statystyki, takich jak 艣rednia lub tryb pewnej zmiennej, poniewa偶 rzeczywi艣cie istnieje populacja.
- Wi臋kszo艣膰 danych analizowanych przez badaczy pochodzi z pr贸bek, a nie z populacji.
Zrozumienie dystrybucji pr贸bkowania
Wiele danych zebranych i wykorzystywanych przez naukowc贸w, statystyk贸w, badaczy, marketer贸w, analityk贸w itp. to w rzeczywisto艣ci pr贸bki, a nie populacje. Pr贸bka to podzbi贸r populacji. Na przyk艂ad, naukowiec medyczny, kt贸ry chcia艂 por贸wna膰 艣redni膮 wag臋 wszystkich dzieci urodzonych w Ameryce P贸艂nocnej w latach 1995-2005 z tymi urodzonymi w Ameryce Po艂udniowej w tym samym czasie, nie mo偶e w rozs膮dnym czasie narysowa膰 danych dla ca艂ej populacji ponad milion porod贸w, kt贸re mia艂y miejsce w ci膮gu dziesi臋ciu lat. Zamiast tego u偶yj膮 wagi, powiedzmy, 100 dzieci na ka偶dym kontynencie, aby wyci膮gn膮膰 wnioski. Waga 200 u偶ytych niemowl膮t jest pr贸bk膮, a obliczona 艣rednia waga jest 艣redni膮 pr贸bki.
Za艂贸偶my teraz, 偶e zamiast pobiera膰 tylko jedn膮 pr贸bk臋 o wadze 100 noworodk贸w z ka偶dego kontynentu, badacz medyczny pobiera powtarzaj膮ce si臋 losowe pr贸bki z populacji og贸lnej i oblicza 艣redni膮 pr贸bki dla ka偶dej grupy pr贸bek. Tak wi臋c, dla Ameryki P贸艂nocnej, pobieraj膮 dane dla 100 mas noworodk贸w zarejestrowanych w USA, Kanadzie i Meksyku w nast臋puj膮cy spos贸b: cztery 100 pr贸bek z wybranych szpitali w USA, pi臋膰 70 pr贸bek z Kanady i trzy 150 rekord贸w z Meksyku, 艂膮cznie 1200 wag noworodk贸w pogrupowanych w 12 kompletach. Zbieraj膮 r贸wnie偶 przyk艂adowe dane 100 wag urodzeniowych z ka偶dego z 12 kraj贸w Ameryki Po艂udniowej.
Ka偶da pr贸bka ma w艂asn膮 艣redni膮 pr贸bki, a rozk艂ad 艣rednich pr贸bki jest znany jako rozk艂ad pr贸bki.
艢rednia waga obliczona dla ka偶dego zestawu pr贸bek to rozk艂ad pr贸bkowania 艣redniej. Nie tylko 艣redni膮 mo偶na obliczy膰 z pr贸bki. Inne statystyki,. takie jak odchylenie standardowe, wariancja, proporcja i zakres, mo偶na obliczy膰 na podstawie danych pr贸bki. Odchylenie standardowe i wariancja mierz膮 zmienno艣膰 rozk艂adu pr贸bkowania.
Liczba obserwacji w populacji, liczba obserwacji w pr贸bie oraz procedura stosowana do losowania zestaw贸w pr贸bek okre艣laj膮 zmienno艣膰 rozk艂adu pr贸bkowania. Odchylenie standardowe rozk艂adu pr贸bkowania nazywane jest b艂臋dem standardowym. Podczas gdy 艣rednia rozk艂adu pr贸bkowania jest r贸wna 艣redniej populacji, b艂膮d standardowy zale偶y od odchylenia standardowego populacji, wielko艣ci populacji i wielko艣ci pr贸by.
Wiedza o tym, jak roz艂o偶one s膮 艣rednie ka偶dego z zestaw贸w pr贸bek wzgl臋dem siebie i 艣redniej populacji, da wskaz贸wk臋, jak blisko jest 艣rednia pr贸bki do 艣redniej populacji. B艂膮d standardowy rozk艂adu pr贸bkowania maleje wraz ze wzrostem liczebno艣ci pr贸by.
Uwagi specjalne
Populacja lub jeden przyk艂adowy zestaw liczb b臋dzie mia艂 rozk艂ad normalny. Jednak poniewa偶 rozk艂ad pr贸bkowania obejmuje wiele zestaw贸w obserwacji, niekoniecznie b臋dzie mia艂 kszta艂t zakrzywiony w kszta艂cie dzwonu.
Id膮c za naszym przyk艂adem, 艣rednia waga dzieci w Ameryce P贸艂nocnej i Ameryce Po艂udniowej ma rozk艂ad normalny, poniewa偶 niekt贸re dzieci b臋d膮 mia艂y niedowag臋 (poni偶ej 艣redniej) lub nadwag臋 (powy偶ej 艣redniej), przy czym wi臋kszo艣膰 dzieci spadnie pomi臋dzy (oko艂o 艣redniej). ). Je艣li 艣rednia waga noworodk贸w w Ameryce P贸艂nocnej wynosi siedem funt贸w, 艣rednia waga pr贸bki w ka偶dym z 12 zestaw贸w obserwacji pr贸bek zarejestrowanych dla Ameryki P贸艂nocnej r贸wnie偶 b臋dzie bliska siedmiu funt贸w.
Je艣li jednak wykre艣lisz na wykresie ka偶d膮 ze 艣rednich obliczonych w ka偶dej z 1200 grup pr贸bek, uzyskany kszta艂t mo偶e skutkowa膰 jednorodnym rozk艂adem, ale trudno jest z ca艂膮 pewno艣ci膮 przewidzie膰, jaki oka偶e si臋 rzeczywisty kszta艂t. Im wi臋cej pr贸bek wykorzysta badacz z populacji licz膮cej ponad milion liczb wagowych, tym bardziej wykres zacznie tworzy膰 rozk艂ad normalny.