Investor's wiki

Stopnie swobody

Stopnie swobody

Jakie są stopnie wolności?

Stopnie swobody odnoszą się do maksymalnej liczby logicznie niezależnych wartości, które są wartościami, które mogą się swobodnie zmieniać w próbce danych.

Zrozumienie stopni wolności

Najłatwiejszym sposobem zrozumienia pojęciowo stopni swobody jest przykład:

  • Rozważmy próbkę danych składającą się, dla uproszczenia, z pięciu dodatnich liczb całkowitych. Wartości mogą być dowolną liczbą bez znanego związku między nimi. Ta próbka danych miałaby teoretycznie pięć stopni swobody.

  • Cztery liczby w próbce to {3, 8, 5 i 4}, a średnia całej próbki danych okazuje się wynosić 6.

  • To musi oznaczać, że piąta liczba musi wynosić 10. To nie może być nic innego. Nie może się zmieniać.

  • Więc stopnie swobody dla tej próbki danych wynoszą 4.

Wzór na stopnie swobody jest równy wielkości próbki danych minus jeden:

Df= N1 gdzie: Df=stopnie swobodyN=rozmiar próbki\begin{ wyrównane} &\text\text = N - 1 \ &\textbf \ &\text\text = \text{stopnie wolność} \ &N = \text{rozmiar próbki} \ \end

Stopnie swobody są powszechnie omawiane w odniesieniu do różnych form testowania hipotez w statystyce, takich jak chi-kwadrat. Niezbędne jest obliczenie stopni swobody, gdy próbujemy zrozumieć znaczenie statystyki chi-kwadrat i słuszność hipotezy zerowej.

Testy chi-kwadrat

Istnieją dwa różne rodzaje testów chi-kwadrat : test niezależności, który zadaje pytanie o związek, takie jak „Czy istnieje związek między płcią a wynikami SAT?”; oraz test dopasowania,. który zadaje pytanie w stylu „Jeśli moneta zostanie rzucona 100 razy, czy 50 razy wypadnie orzeł, a 50 razy?”

W przypadku tych testów wykorzystuje się stopnie swobody w celu określenia, czy pewna hipoteza zerowa może zostać odrzucona na podstawie całkowitej liczby zmiennych i próbek w eksperymencie. Na przykład, biorąc pod uwagę uczniów i wybór kursu, próba licząca 30 lub 40 uczniów prawdopodobnie nie jest wystarczająco duża, aby wygenerować istotne dane. Bardziej zasadne jest uzyskanie takich samych lub podobnych wyników z badania na próbie liczącej 400 lub 500 uczniów.

Historia stopni wolności

Najwcześniejsze i najbardziej podstawowe pojęcie stopni swobody zostało odnotowane na początku XIX wieku, splecione w pracach matematyka i astronoma Carla Friedricha Gaussa. Współczesne użycie i rozumienie tego terminu zostało po raz pierwszy wyjaśnione przez Williama Sealy'ego Gosseta, angielskiego statystyka, w jego artykule „The Probable Error of a Mean”, opublikowanym w Biometrika w 1908 roku pod pseudonimem, aby zachować jego anonimowość.

W swoich pismach Gosset nie używał konkretnie terminu „stopnie wolności”. Podał jednak wyjaśnienie tej koncepcji w trakcie opracowywania tego, co ostatecznie będzie znane jako rozkład T Studenta. Właściwy termin został spopularyzowany dopiero w 1922 roku. Angielski biolog i statystyk Ronald Fisher zaczął używać terminu „stopnie wolności”, kiedy zaczął publikować raporty i dane na temat swojej pracy nad tworzeniem chi-kwadratów.

Przegląd najważniejszych wydarzeń

  • Stopnie swobody są powszechnie omawiane w odniesieniu do różnych form testowania hipotez w statystyce, takich jak chi-kwadrat.

  • Stopnie swobody odnoszą się do maksymalnej liczby logicznie niezależnych wartości, które są wartościami, które mogą się swobodnie zmieniać w próbce danych.

  • Obliczanie stopni swobody jest kluczowe przy próbie zrozumienia znaczenia statystyki chi-kwadrat i poprawności hipotezy zerowej.