Próbka

Co to jest próbka?

Próbka odnosi się do mniejszej, łatwej do zarządzania wersji większej grupy. Jest to podzbiór zawierający cechy większej populacji. Próbki są używane w testach statystycznych, gdy populacja jest zbyt duża, aby test obejmował wszystkich możliwych członków lub obserwacje. Próba powinna reprezentować populację jako całość i nie odzwierciedlać żadnego uprzedzenia w stosunku do określonego atrybutu.

Istnieje kilka technik próbkowania stosowanych przez badaczy i statystyków, z których każda ma swoje zalety i wady.

Zrozumienie próbek

Próbka to bezstronna liczba obserwacji pobranych z populacji. W uproszczeniu populacja to całkowita liczba obserwacji (tj. osobników, zwierząt, przedmiotów, danych itp.) zawartych w danej grupie lub kontekście. Innymi słowy, próbka jest częścią, częścią lub frakcją całej grupy i działa jako podzbiór populacji. Próbki są używane w różnych miejscach, w których prowadzone są badania. Naukowcy, marketerzy, agencje rządowe, ekonomiści i grupy badawcze należą do tych, którzy wykorzystują próbki do swoich badań i pomiarów.

Wykorzystywanie całych populacji do badań wiąże się z wyzwaniami. Naukowcy mogą mieć problemy z uzyskaniem łatwego dostępu do całych populacji. A ze względu na charakter niektórych badań naukowcy mogą mieć trudności z uzyskaniem potrzebnych wyników w odpowiednim czasie. Dlatego wykorzystuje się próbki ludzi. Korzystanie z mniejszej liczby osób reprezentujących całą populację może nadal dawać prawidłowe wyniki, jednocześnie redukując czas i zasoby.

Próbki używane przez badaczy muszą przypominać szerszą populację, aby móc dokonywać dokładnych wnioskowań lub przewidywań. Wszyscy uczestnicy próby powinni mieć te same cechy i cechy. Tak więc, jeśli badanie dotyczy studentów pierwszego roku studiów, próbka powinna stanowić niewielki procent mężczyzn, którzy pasują do tego opisu. Podobnie, jeśli grupa badawcza przeprowadza badanie wzorców snu samotnych kobiet w wieku powyżej 50 lat, próba powinna obejmować tylko kobiety z tej grupy demograficznej.

Uwagi specjalne

Rozważ zespół badaczy akademickich, którzy chcą wiedzieć, ilu studentów studiowało mniej niż 40 godzin do egzaminu CFA i nadal zdało. Ponieważ każdego roku na całym świecie do egzaminu przystępuje ponad 200 000 osób, dotarcie do każdego uczestnika egzaminu skróciłoby czas i zasoby.

W rzeczywistości, zanim dane z populacji zostałyby zebrane i przeanalizowane, upłynęłoby kilka lat, czyniąc analizę bezwartościową, ponieważ pojawiłaby się nowa populacja. Zamiast tego naukowcy mogą pobrać próbkę populacji i uzyskać z niej dane.

Aby uzyskać bezstronną próbę, dobór musi być losowy, aby każdy z populacji miał równe i prawdopodobne szanse na dodanie do grupy próby. Jest to podobne do losowania na loterii i jest podstawą prostego losowania.

W przypadku próby bezstronnej dobór musi być losowy, aby każdy w populacji miał równe szanse na dołączenie do grupy.

Rodzaje próbkowania

Proste losowe próbkowanie

Proste losowe pobieranie próbek jest idealne, jeśli każda jednostka w populacji jest identyczna. Jeśli badacze nie dbają o to, czy ich badani są wyłącznie mężczyznami, czy wyłącznie kobietami, czy też kombinacją obu płci w jakiejś formie, zwykłe losowe pobieranie próbek może być dobrą techniką selekcji.

Załóżmy, że do egzaminu CFA w 2021 r. przystąpiło 200 000 zdających, z czego 40% stanowiły kobiety, a 60% mężczyźni. Próba losowa wylosowana z populacji powinna zatem liczyć 400 kobiet i 600 mężczyzn, co daje łącznie 1000 zdających.

Ale co z przypadkami, w których ważna jest znajomość stosunku mężczyzn do kobiet, którzy zdali test po nauce trwającej mniej niż 40 godzin? W tym przypadku warstwowa próba losowa byłaby lepsza niż prosta próba losowa.

Losowe próbkowanie warstwowe

Ten rodzaj doboru, określany również jako dobór losowy proporcjonalny lub losowy kwotowy, dzieli całą populację na mniejsze grupy. Są to tak zwane warstwy. Ludzie w warstwach mają podobne cechy.

Co by było, gdyby wiek był ważnym czynnikiem, który badacze chcieliby uwzględnić w swoich danych? Korzystając z warstwowej techniki losowego doboru próby, mogli stworzyć warstwy lub warstwy dla każdej grupy wiekowej. Wybór z każdej warstwy musiałby być losowy, aby każdy z przedziału miał prawdopodobną szansę na uwzględnienie w próbie. Na przykład dwoje uczestników, Alex i David, ma odpowiednio 22 i 24 lata. Dobór próby nie może wybierać jednej z drugiej w oparciu o jakiś preferencyjny mechanizm. Oboje powinni mieć równe szanse na wybór ze swojej grupy wiekowej. Warstwy mogą wyglądać mniej więcej tak:

TTT

Z tabeli populację podzielono na grupy wiekowe. Na przykład 30 000 osób w przedziale wiekowym od 20 do 24 lat przystąpiło do egzaminu CFA w 2021 roku. Stosując tę samą proporcję, grupa próbna będzie miała (30 000 ÷ 200 000) × 1000 = 150 zdających, którzy należą do tej grupy. Alex lub David — lub obaj lub żaden z nich — mogą być uwzględnieni wśród 150 losowo wybranych uczestników egzaminu.

Istnieje znacznie więcej warstw, które można zestawić przy podejmowaniu decyzji o wielkości próby. Niektórzy badacze mogą wypełniać funkcje zawodowe, kraje, stan cywilny itp. osób przystępujących do testu, decydując o tym, jak stworzyć próbkę.

Przykłady próbek

W 2021 r. ludność świata liczyła prawie 7,9 miliarda, z czego 49,6% stanowiły kobiety, a 50% mężczyźni. Całkowita liczba osób w danym kraju może być również liczbą ludności. Całkowita liczba uczniów w mieście może być traktowana jako populacja, a całkowita liczba psów w mieście to również wielkość populacji. Próbki można pobrać z tych populacji do celów badawczych.

Idąc za naszym przykładem egzaminu CFA, naukowcy mogli pobrać próbkę 1000 uczestników CFA z łącznej liczby 200 000 zdających – populacji – i przeprowadzić wymagane dane na tej liczbie. Średnia z tej próby zostałaby wzięta pod uwagę w celu oszacowania średniej osób, które zdały egzamin CFA, mimo że uczyły się tylko przez mniej niż 40 godzin.

Pobrana próbka nie powinna być stronnicza. Oznacza to, że jeśli średnia próbki z 1000 uczestników egzaminu CFA wynosi 50, średnia populacji 200 000 zdających powinna również wynosić około 50.

Przegląd najważniejszych wydarzeń

W statystyce próba jest analitycznym podzbiorem większej populacji.
W losowym losowaniu prostym każda jednostka w populacji jest identyczna, podczas gdy losowe losowanie warstwowe dzieli całą populację na mniejsze grupy.
Wykorzystanie próbek pozwala naukowcom na prowadzenie badań z łatwiejszymi do zarządzania danymi iw odpowiednim czasie.
Próbki losowo wylosowane, jeśli są wystarczająco duże, nie mają dużego błędu, ale uzyskanie takiej próby może być kosztowne i czasochłonne.

FAQ

Co to jest prosta próbka losowa?

Ta metoda próbkowania wykorzystuje respondentów lub punkty danych, które są losowo wybierane z większej populacji. Przy wystarczająco dużej próbce losowa próba usuwa stronniczość.

Dlaczego próbki losowe pozwalają na wnioskowanie?

Prawa statystyki sugerują, że przy użyciu próbki można dokonać dokładnych pomiarów i ocen populacji. Analiza wariancji (ANOVA),. regresja liniowa i bardziej zaawansowane techniki modelowania są ważne ze względu na prawo wielkich liczb i centralne twierdzenie graniczne.

Dlaczego analitycy używają próbek zamiast mierzyć populację?

Często populacja jest zbyt duża lub rozległa, aby zmierzyć każdy członek, a pomiar każdego członka byłby kosztowny i czasochłonny. Próba pozwala na wnioskowanie o populacji za pomocą metod statystycznych.

Jak dużej próbki potrzebujesz?

Będzie to zależeć od wielkości populacji i rodzaju analizy, którą chcesz przeprowadzić (np. jakich przedziałów ufności używasz). Analiza mocy to technika matematycznej oceny najmniejszej wymaganej wielkości próbki w oparciu o Twoje potrzeby. Inną praktyczną zasadą jest to, że próbka powinna być wystarczająco duża, ale nie większa niż 10% populacji.