Степени свободы
Что такое степени свободы?
Степени свободы относятся к максимальному количеству логически независимых значений, то есть значений, которые могут свободно изменяться в выборке данных.
Понимание степеней свободы
Самый простой способ концептуально понять степени свободы - это пример:
Рассмотрим выборку данных, состоящую для простоты из пяти положительных целых чисел. Значения могут быть любым числом без известной взаимосвязи между ними. Эта выборка данных теоретически должна иметь пять степеней свободы.
Четыре числа в выборке {3, 8, 5 и 4}, и среднее значение всей выборки данных равно 6.
Это должно означать, что пятое число должно быть 10. Это не может быть ничем другим. У него нет свободы варьироваться.
Таким образом, степени свободы для этой выборки данных равны 4.
Формула для степеней свободы равна размеру выборки данных минус один:
Степени свободы обычно обсуждаются в связи с различными формами проверки гипотез в статистике, такими как хи-квадрат. При попытке понять важность статистики хи-квадрат и достоверность нулевой гипотезы важно рассчитать степени свободы.
Тесты хи-квадрат
Существует два разных вида тестов хи-квадрат : тест на независимость, который задает вопрос о взаимосвязи, например: «Есть ли связь между полом и результатами SAT?»; и тест на соответствие,. который спрашивает что-то вроде «Если монету подбросить 100 раз, выпадет ли она орлом 50 раз и решкой 50 раз?»
Для этих тестов используются степени свободы, чтобы определить, можно ли отвергнуть определенную нулевую гипотезу на основе общего количества переменных и выборок в эксперименте. Например, при рассмотрении студентов и выбора курса размер выборки в 30 или 40 студентов, вероятно, недостаточно велик для получения значимых данных. Получение таких же или подобных результатов исследования с использованием выборки в 400 или 500 студентов является более достоверным.
История степеней свободы
Самая ранняя и самая основная концепция степеней свободы была отмечена в начале 1800-х годов и переплелась в работах математика и астронома Карла Фридриха Гаусса. Современное использование и понимание этого термина были изложены впервые Уильямом Сили Госсетом, английским статистиком, в его статье «Вероятная ошибка среднего», опубликованной в Biometrika в 1908 году под псевдонимом, чтобы сохранить его анонимность.
В своих трудах Госсет специально не использовал термин «степени свободы». Тем не менее, он давал объяснение этой концепции в ходе разработки того, что в конечном итоге стало известно как Т-распределение Стьюдента. Фактический термин не был популярен до 1922 года. Английский биолог и статистик Рональд Фишер начал использовать термин «степени свободы», когда начал публиковать отчеты и данные о своей работе по разработке хи-квадратов.
Особенности
Степени свободы обычно обсуждаются в связи с различными формами проверки гипотез в статистике, такими как хи-квадрат.
Степени свободы относятся к максимальному количеству логически независимых значений, т. е. значений, которые могут изменяться в выборке данных.
Расчет степеней свободы является ключевым моментом при попытке понять важность статистики хи-квадрат и обоснованность нулевой гипотезы.