Investor's wiki

Т-тест

Т-тест

Что такое Т-тест?

Стьюдент-критерий — это тип логической статистики,. используемый для определения того, существует ли значительная разница между средними значениями двух групп, которая может быть связана по определенным признакам. Он в основном используется, когда наборы данных, такие как набор данных, записанный как результат 100-кратного подбрасывания монеты, подчиняются нормальному распределению и могут иметь неизвестные отклонения. В качестве инструмента проверки гипотезы используется t-критерий, который позволяет проверить предположение, применимое к популяции.

Стьюдентный тест рассматривает t-статистику, значения t-распределения и степени свободы для определения статистической значимости. Для проведения теста с тремя и более средними необходимо использовать дисперсионный анализ.

Объяснение Т-теста

По сути, t-тест позволяет нам сравнить средние значения двух наборов данных и определить, получены ли они из одной и той же совокупности. В приведенных выше примерах, если бы мы взяли выборку учащихся из класса A и другую выборку учащихся из класса B, мы не ожидали бы, что они будут иметь точно такое же среднее значение и стандартное отклонение. Точно так же образцы, взятые из контрольной группы, получавшей плацебо, и образцы, взятые из группы, которой прописали лекарство, должны иметь несколько разные среднее значение и стандартное отклонение.

Математически t-критерий берет выборку из каждого из двух наборов и устанавливает постановку задачи, предполагая нулевую гипотезу о том, что два средних равны. На основе применимых формул определенные значения рассчитываются и сравниваются со стандартными значениями, а предполагаемая нулевая гипотеза принимается или отвергается соответственно.

Если нулевая гипотеза может быть отвергнута, это указывает на то, что показания данных сильны и, вероятно, не случайны.

Стьюдент-тест — это лишь один из многих тестов, используемых для этой цели. Статистики должны дополнительно использовать тесты, отличные от t-теста, для изучения большего количества переменных и тестов с большими размерами выборки. Для большого размера выборки статистики используют z-критерий. Другие варианты тестирования включают тест хи-квадрат и f-тест.

Существует три типа t-тестов, и они подразделяются на зависимые и независимые t-тесты.

Неоднозначные результаты теста

Представьте себе, что производитель лекарств хочет протестировать недавно изобретенное лекарство. Это следует стандартной процедуре испытания препарата на одной группе пациентов и назначении плацебо другой группе, называемой контрольной группой. Плацебо, данное контрольной группе, представляет собой вещество, не имеющее предполагаемой терапевтической ценности, и служит эталоном для измерения того, как реагирует другая группа, получающая настоящее лекарство.

После испытания препарата члены контрольной группы, получавшей плацебо, сообщили об увеличении средней продолжительности жизни на три года, в то время как члены группы, которым прописали новое лекарство, сообщили об увеличении средней продолжительности жизни на четыре года. Мгновенное наблюдение может указывать на то, что препарат действительно работает, поскольку результаты лучше для группы, принимающей препарат. Однако также возможно, что наблюдение может быть связано со случайностью, особенно с неожиданным везением. Стьюдентный тест полезен, чтобы сделать вывод, действительно ли результаты верны и применимы ко всей популяции.

В школе 100 учеников класса А набрали в среднем 85% со стандартным отклонением 3%. Еще 100 учеников, принадлежащих к классу B, набрали в среднем 87% при стандартном отклонении 4%. Хотя средний показатель класса B лучше, чем средний показатель класса A, может быть неверным делать поспешный вывод о том, что общая успеваемость учащихся класса B лучше, чем у учащихся класса A. Это связано с естественной изменчивостью в результатах тестов в обоих классах, поэтому разница может быть обусловлена только случайностью. Стьюдентный тест может помочь определить, справился ли один класс лучше, чем другой.

Предположения T-теста

  1. Первое предположение, сделанное в отношении t-тестов, касается масштаба измерения. Предположение для t-теста состоит в том, что шкала измерения, применяемая к собранным данным, соответствует непрерывной или порядковой шкале, такой как баллы для теста IQ.

  2. Второе сделанное предположение относится к простой случайной выборке, когда данные собираются из репрезентативной, случайно выбранной части всего населения.

  3. Третье допущение состоит в том, что данные, нанесенные на график, дают нормальное распределение, колоколообразную кривую распределения.

  4. Последнее допущение — однородность дисперсии. Однородная или равная дисперсия существует, когда стандартные отклонения выборок приблизительно равны.

Вычисление Т-тестов

Для расчета t-критерия требуются три значения ключевых данных. Они включают разницу между средними значениями из каждого набора данных (называемую средней разницей), стандартное отклонение каждой группы и количество значений данных в каждой группе.

Результат t-теста дает t-значение. Это рассчитанное t-значение затем сравнивается со значением, полученным из таблицы критических значений (называемой таблицей T-распределения). Это сравнение помогает определить влияние одной лишь случайности на разницу, а также определить, находится ли разница за пределами этого диапазона вероятности. Стьюдентный критерий ставит вопрос о том, представляет ли разница между группами истинную разницу в исследовании или, возможно, это бессмысленная случайная разница.

Таблицы Т-распределения

Таблица Т-распределения доступна в одностороннем и двустороннем форматах. Первый используется для оценки случаев, которые имеют фиксированное значение или диапазон с четким направлением (положительным или отрицательным). Например, какова вероятность того, что выходное значение останется ниже -3 или будет больше семи при броске пары игральных костей? Последний используется для анализа границ диапазона, например, чтобы узнать, находятся ли координаты в диапазоне от -2 до +2.

Расчеты можно выполнять с помощью стандартных программ, поддерживающих необходимые статистические функции, например, в MS Excel.

T-значения и степени свободы

На выходе t-тест выдает два значения: t-значение и степени свободы. Значение t представляет собой отношение разницы между средним значением двух наборов выборок и вариацией, которая существует в наборах выборок. В то время как значение числителя (разницу между средним значением двух выборочных наборов) вычислить просто, знаменатель (изменение, существующее в выборочных наборах) может стать немного сложным в зависимости от типа задействованных значений данных. Знаменатель отношения является измерением дисперсии или изменчивости. Более высокие значения t-значения, также называемого t-показателем, указывают на то, что между двумя наборами выборок существует большая разница. Чем меньше t-значение, тем больше сходства существует между двумя наборами выборок.

  • Большой t-показатель указывает на то, что группы разные.

  • Небольшой t-показатель указывает на то, что группы похожи.

Степени свободы относятся к значениям в исследовании, которые могут варьироваться и необходимы для оценки важности и достоверности нулевой гипотезы. Вычисление этих значений обычно зависит от количества записей данных, доступных в выборке.

Коррелированный (или парный) Т-тест

Коррелированный t-критерий выполняется, когда выборки обычно состоят из согласованных пар одинаковых единиц или когда есть случаи повторных измерений. Например, могут быть случаи, когда одни и те же пациенты проходят повторное тестирование — до и после получения конкретного лечения. В таких случаях каждый пациент используется в качестве контрольного образца против себя.

Этот метод также применим к случаям, когда образцы каким-либо образом связаны или имеют совпадающие характеристики, например, сравнительный анализ с участием детей, родителей или братьев и сестер. Коррелированные или парные t-критерии относятся к зависимому типу, поскольку они включают случаи, когда два набора выборок связаны.

Формула для вычисления t-значения и степеней свободы для парного t-теста:

T=среднее1среднее2< mfrac>s(diff)(n)< /mfrac>< /mstyle>где:означает1 и означает2=</ mo>Средние значения каждого набора образцовs</ mi>(diff)=Стандартное отклонение различий парных значений данных n= Размер выборки (количество парных различий)</mr ow>n−</ mo>1=Степени свободы< annotation encoding="application/x-tex">\begin&T=\frac{\textit1 - \textit2}{\frac{s(\text)} {\sqrt{(n)}}}\&\textbf{где:}\&\textit1\text{и }\textit2=\text{Средние значения каждого наборов выборок}\&s(\text)=\text{Стандартное отклонение разностей парных значений данных}\&n=\text{Размер выборки (количество парных различия)}\&n-1=\text{Степени свободы}\end<span class="katex-html" aria -hidden="true">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< охватывать class="vlist-t vlist-t2">T=< /span>(n)<path d='M95,702

в-2,7,0,-7,17,-2,7,-13,5,-8в-5,8,-5,3,-9,5,-10,-9,5,-14

с0,-2,0,3,-3,3,1,-4с1,3,-2,7,23,83,-20,7,67,5,-54

с44.2,-33.3,65.8,-50.3,66.5,-51с1.3,-1.3,3,-2,5,-2с4.7,0,8.7,3.3,12,10

с173,378,173,378с0,7,0,35,3,-71,104,-213с68,7,-142,137,5,-285,206,5,-429

с69, -144 104,5, -217,7 106,5, -221

л0 -0

c5.3,-9.3,12,-14,20,-14

Х400000в40Х845.2724

с-225,272,467,-225,272,467с-235,486,-235,486с-2,7,4,7,-9,7,-19,7

в-6,0,-10,-1,-12,-3с-194,-422,-194,-422с-65,47,-65,47з

M834 80h400000v40h-400000z'/> s(</ span>diff)</ span> </ span>означает1означает2< span class="vlist-s">​</ span>где:< /span>означает 1 и означает2</ span>=Средние значения каждого из наборов образцовs(diff )=Стандартное отклонение различий парных значений данных n< span class="mrel">=Размер выборки (количество парных различий)n1=Степени свободы

Остальные два типа относятся к независимым t-тестам. Выборки этих типов выбираются независимо друг от друга, то есть наборы данных в двух группах не относятся к одним и тем же значениям. Они включают такие случаи, как разделение группы из 100 пациентов на две группы по 50 пациентов в каждой. Одна из групп становится контрольной и получает плацебо, а другая группа получает предписанное лечение. Это составляет две независимые группы выборок, которые не связаны друг с другом.

Равная дисперсия (или объединенный) T-тест

Стьюдентный критерий равной дисперсии используется, когда количество выборок в каждой группе одинаково или дисперсия двух наборов данных аналогична. Следующая формула используется для расчета t-значения и степеней свободы для t-критерия равной дисперсии:

T-значение= mean1m< /mi>ean2(n11)×вар1< mn>2+(n21)×var22n 1+n22< /mfrac>×1n1+1< /mn>n2 < mstyle scriptlevel="0" displaystyle="true">где:</ mtr><mstyle scriptlevel="0" displaystyle="true" ">меан1</ mn> и mean2 =Средние значения каждогоиз образцы наборовv</ mi>ar1 и va r2=Дисперсия каждого набора образцов n1 и n2 =Количество записей в каждом наборе образцов\begin&\text{T-значение} = \frac{mean1 - mean2 }{\frac {(n1 - 1) \times var12 + (n2 - 1) \times var22 }{ n1 +n2 - 2}\times \sqrt{ \frac{1} + \frac{1}} } \&\textbf{где:}\&amp ;mean1 \text{ и } mean2 = \text{Средние значения каждого} \&\text{выборочных наборов}\&var1 \text{ и } var2 = \text{Дисперсия каждого из выборочных установлен s}\&n1 \text{ и } n2 = \text{Количество записей в каждом наборе образцов} \end

л0 -0

c4,-6.7,10,-10,18,-10 Н400000v40

Н1013.1с-83,4268,-264,1840с-180,7572,-277876,3,-289913с-4,7,4,7,-12,7,7,-24,7

с-12,0,-12,0с-1,3,-3,3,-3,7,-11,7,-7,-25с-35,3,-125,3,-106,7,-373,3,-214,-744

в-10,12,-21,25,-33,39с-32,39,-32,39с-6,-5,3,-15,-14,-27,-26с25,-30,25,-30

c26.7,-32.7,52,-63,76,-91s52,-60,52,-60s208,722,208,722

с56,-175,3126,3,-397,3211,-666с84,7,-268,7153,8,-488,2207,5,-658,5

с53,7,-170,3,84,5,-266,8,92,5,-289,5з

M1001 80х400000в40х-400000з'/> < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< span class="mord mathnormal">ean2где:< /span>мea< span class="mord mathnormal">n1 и </ span>мean2< span class="mspace" style="margin-right:0.2777777777777778em;">=Средние значения каждого< span class="mord text">наборов образцов< span class="pstrut" style="height:3.32144em;">var 1 и var2= Дисперсия каждого набора образцовn1 и n2= Количество записей в каждом наборе образцов</ диапазон></промежуток></промежуток></промежуток></промежуток>

а также,

Степени свободы=n< mn>1+n22 где:< /mtr>n1 и n2< /mn>=Количество записей в каждом наборе образцов</m tr>\begin &\text{Степени свободы} = n1 + n2 - 2 \ &\textbf{где:}\ &n1 \text{ и } n2 = \text{Количество записей в каждом наборе образцов} \ \end

T-критерий неравной дисперсии

Стьюдентный критерий неравной дисперсии используется, когда количество выборок в каждой группе различно, и дисперсия двух наборов данных также различна. Этот тест также называют t-критерием Уэлча. Следующая формула используется для расчета t-значения и степеней свободы для t-критерия неравной дисперсии:

T-значение= mean1m< /mi>ean2<mo забор=" false">(var1 n1+v</ mi>ar2n2< /mrow><mo забор="false">)</ mtr><mstyle scriptlevel="0" displaystyle="true" ">где: мe an1 и me</ mi>an2=Средние значения каждого< /mstyle>наборов образцовvar1 и var2=Дисперсия каждого набора образцов</ mtext> n1 и n2=Число записей в каждом наборе образцов\begin&\text = \ frac {\ sqrt {\ bigg (\ frac {\ frac \ bigg)}}} \ & amp; \ textbf {где:}\&mean1 \text{ и } mean2 = \text{Средние значения каждого} \&\text{выборочных наборов} \&var1 \text{ и } var2 = \text {Дисперсия каждого набора образцов} \&n1 \text{ и } n2 = \text{Количество записей в каждом наборе образцов} \end< /span>T-value< /span>=< span class="vlist-r">( п1 var 1 < /span>+< span class="mfrac">n2< /span>var2 )<path d='M473,2793

с339,3,-1799,3,509,3,-2700,510,-2702 10-0

c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7

с-90,5,478,-276,2,1466с-185,7,988,-279,5,1483,-281,5,1485с-2,6,-10,9,-24,9

с-8,0,-12,-0,7,-12,-2с0,-1,3,-5,3,-32,-16,-92с-50,7,-293,3,-119,7,-693,3,-207,-1200

с0,-1,3,-5,3,8,7,-16,30с-10,7,21,3,-21,3,42,7,-32,64с-16,33,-16,33с-26,-26,-26,-26

с76,-153,76,-153с77,-151,77,-151с0,7,0,7,35,7,202,105,604с67,3,400,7,102,602,7,104,

606zM1001 80h400000v40H1017.7z'/> < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< span class="mord mathnormal">ean2< span class="vlist" style="height:2.93em;"></ span>где: мea n1 и < /span>мean2=<span class="mspace" " style="margin-right:0.2777777777777778em;">Средние значения каждого наборов образцовvar1 и v ar2=</ span>Дисперсия каждого набора образцовn1 и n2=Количество записей в каждом наборе образцов

а также,

Степени свободы= <mo забор="true">(vаr1 2n1 +var22 n2<mo забор="true">)</ mo>2<mo забор="true">(< mi>var12 n1<mo забор="true">)2</ mn>n11 +<mo забор="true">(v</ mi>ar22n2<mo забор="true">)2n21</ mfrac></ mtd>где: var1 и var2=Дисперсия каждого набора образцов n1 и n< /mi>2=Количество записей в каждом наборе образцов< /mtable>\begin &\text{Степени свободы} = \frac{ \left ( \frac{ var12 } + \frac{ var22 } \right )2 }{ \frac{ \left ( \frac{ var12 } \right )2 }{ n1 - 1 } + \frac{ \left ( \frac { var22 } \right )^2 }{ n2 - 1}} \ &\textbf{где:}\ &var1 \text{ и } var2 = \text{Дисперсия каждого из наборы образцов} \ &n1 \text{ и } n2 = \text{Количество записей в каждом наборе образцов} \ \end< span class="katex-html" aria-hidden="true">< /span><span класс ="vlist-t vlist-t2"> </sp an>Степени свободы< /span>= </ span>n1< /span>1< /span>( n1 < span class="pstrut" style="height:3em;">var1< span class="vlist-r">2)2</ span></ span>+n21</ span>(< span class="mord mtight">n2< /span><span class="mord mathnormal mtight" стиль ="маржа-р ight:0.03588em;">var< /span>22 < /span>) 2< /span> <span class="minner" ">(n1var1< span class="vlist-r">2</ span>​< /span>< /span>+ n2< /span> v</ span>ar2</ span>2 )2 где:var< span class="mord">1 и var</ span>2=</ span>Дисперсия каждого набора образцовn1 и < span class="mord mathnormal">n2< span class="mrel">=Количество записей в каждом наборе образцов</ диапазон></промежуток></промежуток></промежуток></промежуток>

Определение правильного T-теста для использования

Следующая блок-схема может использоваться для определения того, какой t-критерий следует использовать, исходя из характеристик наборов выборок. Ключевые элементы, которые необходимо учитывать, включают сходство записей выборки, количество записей данных в каждой выборке и дисперсию каждой выборки.

Пример Т-теста с неравной дисперсией

Предположим, что мы измеряем по диагонали картины, полученные в художественной галерее. В одну группу образцов входит 10 картин, в другую – 20 картин. Наборы данных с соответствующими средними значениями и значениями дисперсии следующие:

ТТТ

Хотя среднее значение для набора 2 выше, чем для набора 1, мы не можем заключить, что совокупность, соответствующая набору 2, имеет более высокое среднее значение, чем совокупность, соответствующая набору 1. Является ли разница от 19,4 до 21,6 исключительно случайной или действительно ли существуют различия в общей совокупности всех картин, поступивших в картинную галерею? Мы устанавливаем проблему, принимая нулевую гипотезу о том, что среднее значение одинаково для двух наборов выборок, и проводим t-тест, чтобы проверить, правдоподобна ли гипотеза.

Поскольку количество записей данных различно (n1 = 10 и n2 = 20) и дисперсия также различна, значение t и степени свободы вычисляются для вышеуказанного набора данных с использованием формулы, упомянутой в Т-критерии неравной дисперсии. раздел.

Значение t равно -2,24787. Поскольку знак минус можно игнорировать при сравнении двух t-значений, вычисленное значение равно 2,24787.

Значение степени свободы равно 24,38 и уменьшено до 24 из-за определения формулы, требующей округления значения до наименьшего возможного целого числа.

Можно указать уровень вероятности (альфа-уровень, уровень значимости, p) в качестве критерия приемлемости. В большинстве случаев можно принять значение 5%.

Используя значение степени свободы, равное 24, и уровень значимости 5%, просмотр таблицы распределения t-значения дает значение 2,064. Сравнение этого значения с вычисленным значением 2,247 показывает, что рассчитанное значение t больше табличного значения при уровне значимости 5%. Следовательно, можно с уверенностью отвергнуть нулевую гипотезу об отсутствии разницы между средними значениями. Набор населения имеет внутренние различия, и они не случайны.

Особенности

  • t-критерий - это тип логической статистики, используемый для определения того, существует ли значительная разница между средними значениями двух групп, которые могут быть связаны по определенным признакам.

  • t-критерий является одним из многих тестов, используемых для проверки гипотез в статистике.

  • Существует несколько различных типов t-критерия, которые могут быть выполнены в зависимости от требуемых данных и типа анализа.

  • Для расчета t-критерия требуются три значения ключевых данных. Они включают разницу между средними значениями из каждого набора данных (называемую средней разницей), стандартное отклонение каждой группы и количество значений данных в каждой группе.