Przedział ufności
Co to jest przedział ufności?
Przedział ufności w statystyce odnosi się do prawdopodobieństwa, że parametr populacji znajdzie się między zbiorem wartości przez pewien odsetek razy.
Zrozumienie przedziałów ufności
Przedziały ufności mierzą stopień niepewności lub pewności w metodzie pobierania próbek . Mogą przyjąć dowolną liczbę granic prawdopodobieństwa, z których najczęstszym jest 95% lub 99% poziom ufności. Przedziały ufności są przeprowadzane przy użyciu metod statystycznych, takich jak test t.
Statystyka wykorzystuje przedziały ufności do pomiaru niepewności zmiennej próbki. Na przykład badacz wybiera losowo różne próbki z tej samej populacji i oblicza przedział ufności dla każdej próbki, aby zobaczyć, jak może ona reprezentować prawdziwą wartość zmiennej populacji. Otrzymane zbiory danych są różne; niektóre przedziały zawierają prawdziwy parametr populacji, a inne nie.
Przedział ufności to zakres wartości ograniczony powyżej i poniżej średniej statystyki,. który prawdopodobnie zawierałby nieznany parametr populacji. Poziom ufności odnosi się do procentu prawdopodobieństwa lub pewności, że przedział ufności będzie zawierał prawdziwy parametr populacji przy wielokrotnym losowaniu próby losowej. Lub, w języku ojczystym, „jesteśmy w 99% pewni (poziom ufności), że większość tych próbek (przedziały ufności) zawiera prawdziwy parametr populacji”.
Największym nieporozumieniem dotyczącym przedziałów ufności jest to, że reprezentują one procent danych z danej próbki, który mieści się między górną a dolną granicą. Na przykład można błędnie zinterpretować wspomniany 99% przedział ufności od 70 do 78 cali jako wskazujący, że 99% danych w losowej próbce mieści się między tymi liczbami. Jest to niepoprawne, chociaż istnieje oddzielna metoda analizy statystycznej, która umożliwia takie ustalenie. Wymaga to określenia średniej i odchylenia standardowego próbki oraz wykreślenia tych liczb na krzywej dzwonowej.
Przedział ufności i poziom ufności są ze sobą powiązane, ale nie są dokładnie takie same.
Obliczanie przedziału ufności
Załóżmy, że grupa naukowców bada wzrost licealistów w koszykówce. Naukowcy pobierają losową próbkę z populacji i ustalają średnią wysokość 74 cali.
Średnia 74 cale jest oszacowaniem punktowym średniej populacji. Samo oszacowanie punktowe ma ograniczoną użyteczność, ponieważ nie ujawnia niepewności związanej z oszacowaniem; nie masz dobrego wyczucia, jak daleko ta 74-calowa średnia próbki może być od średniej populacji. To, czego brakuje, to stopień niepewności w tej pojedynczej próbce.
Przedziały ufności dostarczają więcej informacji niż szacunki punktowe. Ustalając 95% przedział ufności przy użyciu średniej próbki i odchylenia standardowego oraz zakładając rozkład normalny reprezentowany przez krzywą dzwonową, naukowcy doszli do górnej i dolnej granicy, która zawiera rzeczywistą średnią w 95% przypadków.
Załóżmy, że odstęp wynosi od 72 cali do 76 cali. Jeśli badacze pobiorą 100 losowych próbek z całej populacji licealistów, średnia powinna wynosić od 72 do 76 cali w 95 z tych próbek.
Jeśli badacze chcą jeszcze większej pewności, mogą rozszerzyć przedział do 99% pewności. Takie postępowanie niezmiennie tworzy szerszy zakres, ponieważ zapewnia miejsce na większą liczbę średnich próbek. Jeśli ustalą 99% przedział ufności jako mieszczący się w przedziale od 70 cali do 78 cali, mogą oczekiwać, że 99 na 100 ocenianych próbek będzie zawierało średnią wartość między tymi liczbami.
Z drugiej strony 90% poziom ufności oznacza, że oczekujemy, że 90% oszacowań przedziałów będzie zawierało parametr populacji i tak dalej.
Przegląd najważniejszych wydarzeń
Najczęściej konstruuje się je przy poziomach ufności 95% lub 99%.
Przedział ufności wyświetla prawdopodobieństwo, że parametr znajdzie się pomiędzy parą wartości wokół średniej.
Przedziały ufności mierzą stopień niepewności lub pewności w metodzie pobierania próbek.
FAQ
Jakie jest powszechne błędne przekonanie na temat przedziałów ufności?
Największym nieporozumieniem dotyczącym przedziałów ufności jest to, że reprezentują one procent danych z danej próbki, który mieści się między górną a dolną granicą. Innymi słowy, błędne byłoby założenie, że 99% przedział ufności oznacza, że 99% danych w losowej próbce mieści się między tymi granicami. W rzeczywistości oznacza to, że można być na 99% pewnym, że zakres będzie zawierał średnią populacji.
Co to jest test T?
Przedziały ufności są przeprowadzane przy użyciu metod statystycznych, takich jak test t. Test t jest rodzajem statystyki inferencyjnej używanej do określenia, czy istnieje znacząca różnica między średnimi dwóch grup, które mogą być związane z pewnymi cechami. Obliczenie testu t wymaga trzech kluczowych wartości danych. Obejmują one różnicę między wartościami średnimi z każdego zestawu danych (nazywaną różnicą średnią), odchylenie standardowe każdej grupy oraz liczbę wartości danych w każdej grupie.
Co ujawnia przedział ufności?
Przedział ufności to zakres wartości ograniczony powyżej i poniżej średniej statystyki, który prawdopodobnie zawierałby nieznany parametr populacji. Poziom ufności odnosi się do procentu prawdopodobieństwa lub pewności, że przedział ufności będzie zawierał prawdziwy parametr populacji przy wielokrotnym losowaniu próby losowej.
Jak wykorzystywane są przedziały ufności?
Statystycy używają przedziałów ufności do pomiaru niepewności zmiennej próbki. Na przykład badacz wybiera losowo różne próbki z tej samej populacji i oblicza przedział ufności dla każdej próbki, aby zobaczyć, jak może ona reprezentować prawdziwą wartość zmiennej populacji. Otrzymane zbiory danych są różne, przy czym niektóre przedziały zawierają rzeczywisty parametr populacji, a inne nie.