Investor's wiki

Test T

Test T

Co to jest test T?

Test t jest rodzajem statystyki inferencyjnej używanej do określenia, czy istnieje znacząca różnica między średnimi dwóch grup, które mogą być powiązane w pewnych cechach. Jest najczęściej używany, gdy zestawy danych, takie jak zestaw danych zarejestrowanych jako wynik 100-krotnego rzucenia monetą, miałyby rozkład normalny i mogą mieć nieznane wariancje. Test t jest używany jako narzędzie do testowania hipotez, które pozwala przetestować założenie mające zastosowanie do populacji.

Test t analizuje statystykę t, wartości rozkładu t i stopnie swobody w celu określenia istotności statystycznej. Aby przeprowadzić test z trzema lub więcej średnimi, należy zastosować analizę wariancji.

Wyjaśnienie testu T

Zasadniczo test t pozwala nam porównać średnie wartości dwóch zestawów danych i określić, czy pochodzą z tej samej populacji. W powyższych przykładach, gdybyśmy wzięli próbę uczniów z klasy A i drugą próbę uczniów z klasy B, nie spodziewalibyśmy się, że będą mieli dokładnie taką samą średnią i odchylenie standardowe. Podobnie próbki pobrane z grupy kontrolnej karmionej placebo i próbki pobrane z grupy otrzymującej przepisany lek powinny mieć nieco inną średnią i odchylenie standardowe.

Matematycznie test t pobiera próbkę z każdego z dwóch zestawów i ustala sformułowanie problemu, zakładając hipotezę zerową, że dwie średnie są równe. Na podstawie obowiązujących wzorów wyliczane są określone wartości i porównywane z wartościami standardowymi, a założona hipoteza zerowa jest odpowiednio akceptowana lub odrzucana.

Jeśli hipoteza zerowa kwalifikuje się do odrzucenia, oznacza to, że odczyty danych są silne i prawdopodobnie nie są przypadkowe.

Test t jest tylko jednym z wielu testów wykorzystywanych w tym celu. Statystycy muszą dodatkowo stosować testy inne niż test t, aby zbadać więcej zmiennych i testy z większą liczebnością próby. W przypadku dużej próby statystycy stosują test z. Inne opcje testowania obejmują test chi-kwadrat i test f.

Istnieją trzy rodzaje testów t, które są klasyfikowane jako testy zależne i niezależne.

Niejednoznaczne wyniki testu

Weź pod uwagę, że producent leków chce przetestować nowo wynaleziony lek. Jest to standardowa procedura polegająca na wypróbowaniu leku na jednej grupie pacjentów i podaniu placebo innej grupie, zwanej grupą kontrolną. Placebo podane grupie kontrolnej jest substancją o niezamierzonej wartości terapeutycznej i służy jako punkt odniesienia do pomiaru reakcji drugiej grupy, której podano dany lek.

Po próbie leku członkowie grupy kontrolnej karmionej placebo odnotowali wzrost średniej długości życia o trzy lata, podczas gdy członkowie grupy, którym przepisano nowy lek, odnotowali wzrost średniej długości życia o cztery lata. Natychmiastowa obserwacja może wskazywać, że lek rzeczywiście działa, ponieważ wyniki są lepsze dla grupy stosującej lek. Jednak jest również możliwe, że obserwacja może być wynikiem przypadku, zwłaszcza zaskakującego szczęścia. Test t jest przydatny do stwierdzenia, czy wyniki są rzeczywiście poprawne i mają zastosowanie do całej populacji.

W szkole 100 uczniów w klasie A uzyskało średnio 85% z odchyleniem standardowym 3%. Kolejnych 100 uczniów należących do klasy B uzyskało średnio 87% przy odchyleniu standardowym 4%. Chociaż średnia z klasy B jest lepsza niż z klasy A, może nie być właściwe wyciąganie pochopnego wniosku, że ogólne wyniki uczniów z klasy B są lepsze niż uczniów z klasy A. Dzieje się tak, ponieważ istnieje naturalna zmienność w wynikach testu w obu klasach, więc różnica może wynikać wyłącznie z przypadku. Test t może pomóc w ustaleniu, czy jedna klasa wypada lepiej niż druga.

Założenia testu T

  1. Pierwsze założenie przyjęte w odniesieniu do testów t dotyczy skali pomiaru. Założeniem testu t jest to, że skala pomiaru zastosowana do zebranych danych jest zgodna ze skalą ciągłą lub porządkową, taką jak wyniki testu IQ.

  2. Drugie przyjęte założenie dotyczy prostej próby losowej, że dane są zbierane z reprezentatywnej, losowo wybranej części całej populacji.

  3. Trzecim założeniem jest to, że dane, po wykreśleniu, dają rozkład normalny, krzywa rozkładu w kształcie dzwonu.

  4. Ostatecznym założeniem jest jednorodność wariancji. Jednorodna lub równa wariancja występuje, gdy odchylenia standardowe próbek są w przybliżeniu równe.

Obliczanie testów T

Obliczenie testu t wymaga trzech kluczowych wartości danych. Obejmują one różnicę między średnimi wartościami z każdego zestawu danych (zwaną średnią różnicą), odchylenie standardowe każdej grupy oraz liczbę wartości danych każdej grupy.

Wynik testu t daje wartość t. Ta obliczona wartość t jest następnie porównywana z wartością uzyskaną z tabeli wartości krytycznych (zwanej tabelą rozkładu T). To porównanie pomaga określić wpływ samego przypadku na różnicę i czy różnica leży poza tym zakresem szansy. Test t kwestionuje, czy różnica między grupami reprezentuje prawdziwą różnicę w badaniu, czy też jest to prawdopodobnie bezsensowna różnica losowa.

Tabele dystrybucji T

Tabela dystrybucji T jest dostępna w formatach jednostronnych i dwustronnych . Pierwsza służy do oceny przypadków, które mają ustaloną wartość lub zakres z wyraźnym kierunkiem (pozytywnym lub negatywnym). Na przykład, jakie jest prawdopodobieństwo, że wartość wyjściowa pozostanie poniżej -3 lub uzyska więcej niż siedem podczas rzucania parą kości? Ta ostatnia jest używana do analizy ograniczonej zakresem, takiej jak pytanie, czy współrzędne mieszczą się w przedziale od -2 do +2.

Obliczenia można wykonać za pomocą standardowych programów, które obsługują niezbędne funkcje statystyczne, takie jak te znajdujące się w MS Excel.

T-wartości i stopnie swobody

Test t daje na wyjściu dwie wartości: wartość t i stopnie swobody. Wartość t jest stosunkiem różnicy między średnią z dwóch zestawów próbek a zmiennością istniejącą w zestawach próbek. Podczas gdy wartość licznika (różnica między średnią z dwóch zestawów próbek) jest łatwa do obliczenia, mianownik (odmiana występująca w zestawach próbek) może stać się nieco skomplikowana w zależności od typu zaangażowanych wartości danych. Mianownik tego stosunku jest miarą rozrzutu lub zmienności. Wyższe wartości wartości t, zwanej również t-score, wskazują, że istnieje duża różnica między dwoma zestawami próbek. Im mniejsza wartość t, tym większe podobieństwo między dwoma zestawami próbek.

  • Duży t-score wskazuje, że grupy są różne.

  • Mały t-score wskazuje, że grupy są podobne.

Stopnie swobody odnoszą się do wartości w badaniu, które mogą się zmieniać i są niezbędne do oceny ważności i ważności hipotezy zerowej. Obliczenie tych wartości zwykle zależy od liczby rekordów danych dostępnych w zestawie próbek.

Skorelowany (lub sparowany) test T

Skorelowany test t jest wykonywany, gdy próbki zazwyczaj składają się z dopasowanych par podobnych jednostek lub gdy występują przypadki powtarzanych pomiarów. Na przykład mogą wystąpić przypadki wielokrotnego testowania tych samych pacjentów — przed i po otrzymaniu określonego leczenia. W takich przypadkach każdy pacjent jest używany jako próbka kontrolna przeciwko sobie.

Metoda ta ma również zastosowanie do przypadków, w których próbki są w jakiś sposób powiązane lub mają cechy dopasowania, takie jak analiza porównawcza dzieci, rodziców lub rodzeństwa. Skorelowane lub sparowane testy t są typu zależnego, ponieważ dotyczą przypadków, w których dwa zestawy próbek są ze sobą powiązane.

Wzór na obliczenie wartości t i stopni swobody dla sparowanego testu t:

T=średnia1średnia2< mfrac>s(różnic)(n)< /mfrac>< /mstyle>gdzie:średnia1 i średnia2=</ mo>Średnie wartości każdego z przykładowych zestawów<mstyle scriptlevel="0" styl wyświetlania =" true">s </ mi>(różnic)= odchylenie standardowe różnic sparowanych wartości danych< mrow> n= Wielkość próbki (liczba sparowanych różnic)</mr ow>n−</ mo>1=Stopnie swobody< annotation encoding="application/x-tex">\begin&T=\frac{\textit1 - \textit2}{\frac{s(\text)} {\sqrt{(n)}}}\&\textbf\&\textit{średnia}1\text\textit{średnia}2=\text{Wartości średnie każdego z zestawów próbek}\&s(\text)=\text{Odchylenie standardowe różnic sparowanych wartości danych}\&n=\text{Wielkość próbki (liczba par różnic)}\&n-1=\text\end{wyrównane}<span class="katex-html " aria -hidden="true">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="vlist-t vlist-t2">T=< /span>(n)<path d='M95,702

c-2.7,0,-7.17,-2.7,-13.5,-8c-5,8,-5,3,-9.5,-10,-9.5,-14

c0,-2,0.3,-3.3,1,-4c1.3,-2.7,23.83,-20.7.67,5,-54

c44,2,-33,3,65,8,-50,3,66,5,-51c1,3,-1,3,3,-2,5,-2c4.7,0,8.7,3.3,12,10

s173 378 173 378c0.7,0,35,3,-71,104,-213c68,7,-142,137,5,-285,206,5,-429

c69,-144,104,5,-217,7,106,5,-221

l0-0

c5.3,-9.3,12,-14,20,-14

H400000v40H845,2724

s-225.272.467,-225.272.467s-235.486,-235.486c-2.7,4.7,-9,7,-19,7

c-6.0,-10,-1,-12,-3s-194,-422,-194,-422s-65.47,-65.47z

M834 80h400000v40h-400000z'/> s(</ span>różnica))</ span> < /span></ span>średnia1średnia2< span class="vlist-s"></ span >gdzie:< /span>średnia 1 i średnia2</ span>=Średnie wartości każdego z zestawów próbeks (różnic )=Odchylenie standardowe różnic sparowanych wartości danych n< span class="mrel">=Wielkość próbki (liczba par różnic)n1=Stopnie swobody

Pozostałe dwa typy należą do niezależnych t-testów. Próbki tych typów są wybierane niezależnie od siebie — to znaczy, że zestawy danych w dwóch grupach nie odwołują się do tych samych wartości. Obejmują przypadki, takie jak grupa 100 pacjentów podzielona na dwa zestawy po 50 pacjentów każdy. Jedna z grup staje się grupą kontrolną i otrzymuje placebo, podczas gdy druga grupa otrzymuje przepisane leczenie. Stanowi to dwie niezależne grupy próbek, które nie są ze sobą sparowane.

Test T równej wariancji (lub połączony)

Test t równej wariancji jest stosowany, gdy liczba próbek w każdej grupie jest taka sama lub wariancja dwóch zestawów danych jest podobna. Do obliczenia wartości t i stopni swobody dla testu t równej wariancji stosuje się następujący wzór:

Wartość T= mean1m< /mi>ean2(n11)×var1< mn>2+(n21)×var22n 1+n22< /mfrac>×1n1+1< /mn>n2 < mstyle scriptlevel="0" displaystyle="true">gdzie:</ mtr>mean1</ mn> i mean2 =Średnie wartości każdego zestawów przykładowychv</ mi>ar1 i va r2=Wariancja każdego z zestawów próbek n1 i n2 =Liczba rekordów w każdym zestawie próbek\begin{wyrównane}&\text{wartość T} = \frac{ średnia1 - średnia2 }{\frac {(n1 - 1) \times var12 + (n2 - 1) \times var22 }{ n1 +n2 - 2}\times \sqrt{ \frac{1} + \frac{1}} } \&\textbf\&amp ;mean1 \text mean2 = \text{Średnie wartości każdego} \&\text{z zestawów próbek}\&var1 \text var2 = \text{Wariancja każdego z zestaw próbek s}\&n1 \text n2 = \text{Liczba rekordów w każdym zestawie próbek} \end

l0-0

c4,-6,7,10,-10,18,-10 H400000v40

H1013.1s-83.4.268,-264,1,840c-180.7.572,-277.876,3,-289,913c-4.7.4.7,-12.7.7,-24,7

s-12,0,-12,0c-1,3,-3,3,-3,7,-11,7,-7,-25c-35,3,-125,3,-106,7,-373,3,-214,-744

c-10.12,-21.25,-33.39s-32.39,-32.39c-6,-5.3,-15,-14,-27,-26s25,-30.25,-30

c26.7,-32.7,52,-63.76,-91s52,-60.52,-60s208,722,208,722

c56,-175,3,126,3,-397,3,211,-666c84,7,-268,7,153,8,-488,2,207,5,-658,5

c53,7,-170,3,84,5,-266,8,92,5,-289,5z

M1001 80h400000v40h-400000z'/> < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< span class="mord mathnormal">ean2<​< span class="vlist" style="height:1.73em;"></ span>gdzie: mea < span class="mord mathnormal">n1 i < / span>mean2< span class="mspace" style="margin-right:0.27777777777777778em;">=Średnie wartości każdego< span class="mord text">zestawów przykładowych< span class="pstrut" style="height:3.32144em;">var 1 i var2= Wariancja każdego z zestawów próbekn1 i n2= Liczba rekordów w każdym zestawie próbek</ span>

oraz,

Stopnie wolności=n< mn>1+n22 gdzie:< /mtr>n1 i n2< /mn>=Liczba rekordów w każdym zestawie próbek</m tr>\begin &\text{Stopień wolności} = n1 + n2 - 2 \ &\textbf\ &n1 \text n2 = \text{Liczba rekordów w każdym zestawie próbek} \ \end

Test T nierównej wariancji

Test t dla nierównej wariancji jest stosowany, gdy liczba próbek w każdej grupie jest inna, a wariancja dwóch zestawów danych jest również inna. Ten test jest również nazywany testem t Welcha. Poniższy wzór służy do obliczania wartości t i stopni swobody dla testu t nierównej wariancji:

Wartość T= mean1m< /mi>ean2(var1 n1+v</ mi>ar2n2< /mrow>)</ mtr><mstyle scriptlevel="0" displaystyle="true „>gdzie: me an1 i me</ mi>an2=Średnie wartości każdego< /mstyle> z zestawów przykładowych <mtr < mrow >var1 i < mi >var2=Wariancja każdego z zestawów próbek< / mtext> n1 i n2=Liczba rekordy w każdym zestawie próbek\begin&\text {wartość-T}=\frac{średnia1-średnia2}{\sqrt{\bigg(\frac{+\frac\bigg)))}\&\textbf \&mean1 \text mean2 = \text{Średnie wartości każdego} \&\text{z zestawów próbek} \&var1 \text var2 = \text {Wariancja każdego z zestawów próbek} \&n1 \text n2 = \text{Liczba rekordów w każdym zestawie próbek} \end< /span>< span class="vlist-t vlist-t2">Wartość T< /span>=< span class="vlist-r">( n1 var 1 < /span>+< span class="mfrac">n2< /span>var2 < /span>)<ścieżka d='M473,2793

c339,3,-1799,3,509,3,-2700,510,-2702 l0 -0

c3.3,-7,3,9.3,-11,18,-11 H400000v40H1017.7

s-90,5478,-276,2,1466c-185,7,988,-279,5,1483,-281,5,1485c-2,6,-10,9,-24,9

c-8,0,-12,-0.7,-12,-2c0,-1,3,-5,3,-32,-16,-92c-50.7,-293.3,-119,7,-693.3,-207,-1200

c0,-1,3,-5,3,8,7,-16,30c-10,7,21,3,-21,3,42,7,-32,64s-16,33,-16,33s-26,-26,-26,-26

s76,-153,76,-153s77,-151,77,-151c0,7,0,7,35,7,202,105,604c67,3,400,7,102,602,7,104,

606zM1001 80h400000v40H1017.7z'/> < span style="top:-4.064985em;">< span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< span class="mord mathnormal">ean2< span class="vlist" style="height:2.93em;"></ span>gdzie: mea n1 i < /span>mean2=Średnie wartości każdego</ span> zestawów przykładowych var1 i < /span >v ar2=</ span>Wariancja każdego z zestawów próbekn1 i n2=Liczba rekordów w każdym zestawie próbek

oraz,

Stopnie wolności= (var1 2n1 + var22 n2))</ mo>2(< mi>var12 n1))2</ mn>n11 +(v</ mi>ar22n2))2n21</ mfrac></ mtd>gdzie: var1 i var2=Wariancja każdego z zestawów próbek n1 i n< /mi>2=Liczba rekordów w każdym zestawie próbek< /mtable>\begin &\text{Stopnie wolności} = \frac{ \left ( \frac{ var12 } + \frac{ var22 } \right )2 }{ \frac{ \left ( \frac{ var12 } \right )2 }{ n1 - 1 } + \frac{ \left ( \frac { var22 } \right )^2 }{ n2 - 1}} \ &\textbf\ &var1 \text var2 = \text{Wariancja każdego zestawy próbek} \ &n1 \text n2 = \text{Liczba rekordów w każdym zestawie próbek} \ \end< span class="katex-html" aria-hidden="true">< /span><​ </sp an>Stopnie wolności< /span>= </ span>n1< /span>1< /span>( n1 < span class="pstrut" style="height:3em;">var1< span class="vlist-r">2)2</ span></ span>+n21</ span>(< span class="mord mtight">n2< /span>var< /span>22 ></ span>) < /span>2< /span><​ (n1var1< span class="vlist-r">2</ span>​< /span>< /span>+ n2< /span> v</ span>ar2</ span>2 < span>))2 < /span> gdzie:var< span class="mord">1 i var</ span>2=</ span>Wariancja każdego z zestawów próbekn1 i < span class="mord mathnormal">n2< span class="mrel">=Liczba rekordów w każdym zestawie próbek< span class="vlist-r">< / span>

Określanie prawidłowego testu T do użycia

Poniższy schemat blokowy może być wykorzystany do określenia, który test t należy zastosować w oparciu o charakterystykę zestawów próbek. Kluczowe elementy, które należy wziąć pod uwagę, obejmują to, czy rekordy próbek są podobne, liczba rekordów danych w każdym zestawie próbek oraz wariancja każdego zestawu próbek.

Przykład testu T z nierówną wariancją

Załóżmy, że dokonujemy pomiaru po przekątnej obrazów otrzymanych w galerii sztuki. Jedna grupa próbek obejmuje 10 obrazów, druga zawiera 20 obrazów. Zestawy danych, z odpowiednimi wartościami średniej i wariancji, są następujące:

TTT

Chociaż średnia z Zestawu 2 jest wyższa niż z Zestawu 1, nie możemy stwierdzić, że populacja odpowiadająca Zestawowi 2 ma wyższą średnią niż populacja odpowiadająca Zestawowi 1. Czy różnica od 19,4 do 21,6 wynika z samego przypadku, czy też Czy rzeczywiście istnieją różnice w ogólnej populacji wszystkich obrazów otrzymanych w galerii sztuki? Ustalamy problem, zakładając hipotezę zerową, że średnia między dwoma zestawami próbek jest taka sama, i przeprowadzamy test t, aby sprawdzić, czy hipoteza jest wiarygodna.

Ponieważ liczba rekordów danych jest różna (n1 = 10 i n2 = 20), a wariancja również jest inna, wartość t i stopnie swobody są obliczane dla powyższego zbioru danych przy użyciu wzoru wymienionego w teście T nierównej wariancji Sekcja.

Wartość t wynosi -2,24787. Ponieważ znak minus można zignorować podczas porównywania dwóch wartości t, obliczona wartość wynosi 2,24787.

Wartość stopni swobody wynosi 24,38 i jest redukowana do 24, ponieważ definicja formuły wymaga zaokrąglenia wartości w dół do najmniejszej możliwej liczby całkowitej.

Jako kryterium akceptacji można określić poziom prawdopodobieństwa (poziom alfa, poziom istotności, p). W większości przypadków można przyjąć wartość 5%.

Używając wartości stopnia swobody jako 24 i 5% poziomu istotności, spojrzenie na tabelę rozkładu wartości t daje wartość 2,064. Porównanie tej wartości z obliczoną wartością 2,247 wskazuje, że obliczona wartość t jest większa niż wartość tabeli przy poziomie istotności 5%. Dlatego można bezpiecznie odrzucić hipotezę zerową, że nie ma różnicy między średnimi. Zestaw populacji ma wewnętrzne różnice i nie są one przypadkowe.

##Przegląd najważniejszych wydarzeń

  • Test t jest rodzajem statystyki inferencyjnej używanej do określenia, czy istnieje znacząca różnica między średnimi dwóch grup, które mogą być powiązane w pewnych cechach.

  • Test t jest jednym z wielu testów wykorzystywanych do testowania hipotez w statystyce.

  • Istnieje kilka różnych typów testów t, które można przeprowadzić w zależności od wymaganych danych i rodzaju analizy.

  • Obliczenie testu t wymaga trzech kluczowych wartości danych. Obejmują one różnicę między średnimi wartościami z każdego zestawu danych (zwaną średnią różnicą), odchylenie standardowe każdej grupy oraz liczbę wartości danych każdej grupy.