Stopnie swobody
Jakie są stopnie wolności?
Stopnie swobody odnoszą się do maksymalnej liczby logicznie niezależnych wartości, które są wartościami, które mogą się swobodnie zmieniać w próbce danych.
Zrozumienie stopni wolności
Najłatwiejszym sposobem zrozumienia pojęciowo stopni swobody jest przykład:
Rozważmy próbkę danych składającą się, dla uproszczenia, z pięciu dodatnich liczb całkowitych. Wartości mogą być dowolną liczbą bez znanego związku między nimi. Ta próbka danych miałaby teoretycznie pięć stopni swobody.
Cztery liczby w próbce to {3, 8, 5 i 4}, a średnia całej próbki danych okazuje się wynosić 6.
To musi oznaczać, że piąta liczba musi wynosić 10. To nie może być nic innego. Nie może się zmieniać.
Więc stopnie swobody dla tej próbki danych wynoszą 4.
Wzór na stopnie swobody jest równy wielkości próbki danych minus jeden:
Stopnie swobody są powszechnie omawiane w odniesieniu do różnych form testowania hipotez w statystyce, takich jak chi-kwadrat. Niezbędne jest obliczenie stopni swobody, gdy próbujemy zrozumieć znaczenie statystyki chi-kwadrat i słuszność hipotezy zerowej.
Testy chi-kwadrat
Istnieją dwa różne rodzaje testów chi-kwadrat : test niezależności, który zadaje pytanie o związek, takie jak „Czy istnieje związek między płcią a wynikami SAT?”; oraz test dopasowania,. który zadaje pytanie w stylu „Jeśli moneta zostanie rzucona 100 razy, czy 50 razy wypadnie orzeł, a 50 razy?”
W przypadku tych testów wykorzystuje się stopnie swobody w celu określenia, czy pewna hipoteza zerowa może zostać odrzucona na podstawie całkowitej liczby zmiennych i próbek w eksperymencie. Na przykład, biorąc pod uwagę uczniów i wybór kursu, próba licząca 30 lub 40 uczniów prawdopodobnie nie jest wystarczająco duża, aby wygenerować istotne dane. Bardziej zasadne jest uzyskanie takich samych lub podobnych wyników z badania na próbie liczącej 400 lub 500 uczniów.
Historia stopni wolności
Najwcześniejsze i najbardziej podstawowe pojęcie stopni swobody zostało odnotowane na początku XIX wieku, splecione w pracach matematyka i astronoma Carla Friedricha Gaussa. Współczesne użycie i rozumienie tego terminu zostało po raz pierwszy wyjaśnione przez Williama Sealy'ego Gosseta, angielskiego statystyka, w jego artykule „The Probable Error of a Mean”, opublikowanym w Biometrika w 1908 roku pod pseudonimem, aby zachować jego anonimowość.
W swoich pismach Gosset nie używał konkretnie terminu „stopnie wolności”. Podał jednak wyjaśnienie tej koncepcji w trakcie opracowywania tego, co ostatecznie będzie znane jako rozkład T Studenta. Właściwy termin został spopularyzowany dopiero w 1922 roku. Angielski biolog i statystyk Ronald Fisher zaczął używać terminu „stopnie wolności”, kiedy zaczął publikować raporty i dane na temat swojej pracy nad tworzeniem chi-kwadratów.
Przegląd najważniejszych wydarzeń
Stopnie swobody są powszechnie omawiane w odniesieniu do różnych form testowania hipotez w statystyce, takich jak chi-kwadrat.
Stopnie swobody odnoszą się do maksymalnej liczby logicznie niezależnych wartości, które są wartościami, które mogą się swobodnie zmieniać w próbce danych.
Obliczanie stopni swobody jest kluczowe przy próbie zrozumienia znaczenia statystyki chi-kwadrat i poprawności hipotezy zerowej.