Investor's wiki

T testi

T testi

T-Testi Nedir?

iki grubun ortalamaları arasında belirli özelliklerle ilişkili olabilecek anlamlı bir fark olup olmadığını belirlemek için kullanılan bir tür çıkarımsal istatistiktir . Genellikle, 100 kez yazı tura atmanın sonucu olarak kaydedilen veri seti gibi veri setleri normal bir dağılım izleyecekse ve bilinmeyen varyanslara sahip olabilirse kullanılır. Bir popülasyona uygulanabilir bir varsayımın test edilmesini sağlayan bir hipotez test aracı olarak bir t-testi kullanılır.

Bir t-testi, istatistiksel anlamlılığı belirlemek için t-istatistiğine, t-dağılım değerlerine ve serbestlik derecelerine bakar. Üç veya daha fazla araçla bir test yapmak için bir varyans analizi kullanmak gerekir.

T-Testini Açıklama

Esasen, bir t-testi, iki veri setinin ortalama değerlerini karşılaştırmamıza ve aynı popülasyondan gelip gelmediklerini belirlememize olanak tanır. Yukarıdaki örneklerde, A sınıfından bir öğrenci örneği ve B sınıfından bir öğrenci örneği alacak olsaydık, bunların tam olarak aynı ortalama ve standart sapmaya sahip olmalarını beklemezdik. Benzer şekilde, plasebo ile beslenen kontrol grubundan alınan numuneler ile ilaç reçete edilen gruptan alınan numuneler, biraz farklı ortalama ve standart sapmaya sahip olmalıdır.

Matematiksel olarak, t-testi iki kümenin her birinden bir örnek alır ve iki ortalamanın eşit olduğuna dair boş bir hipotez varsayarak problem ifadesini oluşturur. Uygulanabilir formüllere dayalı olarak belirli değerler hesaplanır ve standart değerlerle karşılaştırılır ve buna göre varsayılan sıfır hipotezi kabul edilir veya reddedilir.

Boş hipotez reddedilmeyi hak ediyorsa, veri okumalarının güçlü olduğunu ve muhtemelen şansa bağlı olmadığını gösterir.

T testi, bu amaçla kullanılan birçok testten sadece biridir. İstatistikçiler, daha fazla değişkeni ve daha büyük örneklem boyutlarına sahip testleri incelemek için t-testi dışındaki testleri de kullanmalıdır. Büyük bir örneklem boyutu için istatistikçiler bir z-testi kullanır. Diğer test seçenekleri, ki-kare testi ve f-testini içerir.

Üç tür t testi vardır ve bunlar bağımlı ve bağımsız t testleri olarak sınıflandırılır.

Belirsiz Test Sonuçları

Bir ilaç üreticisinin yeni icat edilmiş bir ilacı test etmek istediğini düşünün. İlacın bir grup hasta üzerinde denenmesi ve kontrol grubu olarak adlandırılan başka bir gruba plasebo verilmesi standart prosedürünü takip eder. Kontrol grubuna verilen plasebo, amaçlanan terapötik değeri olmayan bir maddedir ve asıl ilacı verilen diğer grubun nasıl tepki verdiğini ölçmek için bir ölçüt görevi görür.

İlaç denemesinden sonra, plasebo ile beslenen kontrol grubunun üyeleri ortalama yaşam beklentisinde üç yıllık bir artış bildirirken, yeni ilaç reçete edilen grubun üyeleri ortalama yaşam beklentisinde dört yıllık bir artış bildirdi. Anında gözlem, ilacın gerçekten işe yaradığını gösterebilir, çünkü sonuçlar ilacı kullanan grup için daha iyidir. Bununla birlikte, gözlemin tesadüfi bir olaya, özellikle de şaşırtıcı bir şans parçasına bağlı olması da mümkündür. Sonuçların gerçekten doğru ve tüm popülasyona uygulanabilir olup olmadığına karar vermek için bir t-testi yararlıdır.

Bir okulda, A sınıfındaki 100 öğrenci, %3 standart sapma ile ortalama %85 puan aldı. B sınıfına ait diğer 100 öğrenci, %4 standart sapma ile ortalama %87 puan aldı. B sınıfının ortalaması A sınıfının ortalamasından daha iyi olsa da, B sınıfındaki öğrencilerin genel performansının A sınıfındaki öğrencilerden daha iyi olduğu sonucuna varmak doğru olmayabilir. Bunun nedeni, doğal değişkenlik olmasıdır. her iki sınıftaki test puanlarında, bu nedenle fark sadece şanstan kaynaklanıyor olabilir. Bir t testi, bir sınıfın diğerinden daha iyi olup olmadığını belirlemeye yardımcı olabilir.

T-Testi Varsayımları

  1. t-testleri ile ilgili yapılan ilk varsayım, ölçüm ölçeği ile ilgilidir. Bir t testinin varsayımı, toplanan verilere uygulanan ölçüm ölçeğinin, bir IQ testi puanları gibi sürekli veya sıralı bir ölçeği takip etmesidir.

  2. Yapılan ikinci varsayım, verilerin toplam nüfusun temsili, rastgele seçilmiş bir bölümünden toplandığı basit bir rastgele örneklem varsayımıdır.

  3. Üçüncü varsayım, veriler çizildiğinde, normal dağılım, çan şeklindeki dağılım eğrisi ile sonuçlanır.

  4. Son varsayım, varyansın homojenliğidir. Homojen veya eşit varyans, numunelerin standart sapmaları yaklaşık olarak eşit olduğunda ortaya çıkar.

T-Testlerini Hesaplama

Bir t-testi hesaplamak için üç anahtar veri değeri gerekir. Her bir veri setinden elde edilen ortalama değerler arasındaki farkı (ortalama fark olarak adlandırılır), her grubun standart sapmasını ve her grubun veri değerlerinin sayısını içerirler.

t-testinin sonucu t-değerini üretir. Bu hesaplanan t-değeri daha sonra kritik bir değer tablosundan (T-Dağılım Tablosu olarak adlandırılır) elde edilen bir değerle karşılaştırılır. Bu karşılaştırma, tek başına şansın fark üzerindeki etkisini ve farkın bu şans aralığının dışında olup olmadığını belirlemeye yardımcı olur. T-testi, gruplar arasındaki farkın çalışmada gerçek bir farklılığı temsil edip etmediğini veya muhtemelen anlamsız rastgele bir fark olup olmadığını sorgular.

T-Dağılım Tabloları

T-Dağılım Tablosu tek kuyruklu ve iki kuyruklu formatlarda mevcuttur. İlki, sabit bir değere veya net bir yöne (olumlu veya olumsuz) sahip aralığa sahip vakaları değerlendirmek için kullanılır. Örneğin, bir çift zar atıldığında çıktı değerinin -3'ün altında kalma veya yediden fazla çıkma olasılığı nedir? İkincisi, koordinatların -2 ile +2 arasında olup olmadığını sormak gibi menzil sınırı analizi için kullanılır.

Hesaplamalar, MS Excel'de bulunanlar gibi gerekli istatistiksel işlevleri destekleyen standart yazılım programları ile yapılabilir.

T-Değerleri ve Serbestlik Dereceleri

T testi, çıktısı olarak iki değer üretir: t değeri ve serbestlik derecesi. t-değeri, iki örnek kümesinin ortalaması ile örnek kümeleri içinde var olan varyasyon arasındaki farkın bir oranıdır. Pay değeri (iki örnek setin ortalaması arasındaki fark) hesaplanması basit olsa da, payda (örnek setler içinde var olan varyasyon) ilgili veri değerlerinin türüne bağlı olarak biraz karmaşık hale gelebilir. Oranın paydası, dağılımın veya değişkenliğin bir ölçümüdür. t-skoru olarak da adlandırılan t-değerinin daha yüksek değerleri, iki örnek set arasında büyük bir fark olduğunu gösterir. t değeri ne kadar küçükse, iki örnek seti arasında o kadar fazla benzerlik vardır.

  • Büyük bir t-skoru, grupların farklı olduğunu gösterir.

  • Küçük bir t-skoru grupların benzer olduğunu gösterir.

Serbestlik dereceleri, bir çalışmadaki değişkenlik özgürlüğüne sahip olan ve sıfır hipotezinin önemini ve geçerliliğini değerlendirmek için gerekli olan değerleri ifade eder. Bu değerlerin hesaplanması genellikle numune setinde mevcut olan veri kayıtlarının sayısına bağlıdır.

İlişkili (veya Eşleştirilmiş) T-Testi

Korelasyonlu t-testi, numuneler tipik olarak benzer birimlerin eşleşen çiftlerinden oluştuğunda veya tekrarlanan ölçüm durumları olduğunda gerçekleştirilir. Örneğin, aynı hastaların belirli bir tedaviyi almadan önce ve sonra tekrar tekrar test edildiği durumlar olabilir. Bu gibi durumlarda her hasta kendisine karşı kontrol numunesi olarak kullanılmaktadır.

Bu yöntem aynı zamanda örneklerin bir şekilde ilişkili olduğu veya çocukları, ebeveynleri veya kardeşleri içeren karşılaştırmalı bir analiz gibi eşleşen özelliklere sahip olduğu durumlar için de geçerlidir. İlişkili veya eşleştirilmiş t testleri, iki örnek kümesinin ilişkili olduğu durumları içerdiğinden, bağımlı tiptedir.

Eşleştirilmiş bir t-testi için t-değerini ve serbestlik derecesini hesaplama formülü şu şekildedir:

T=ortalama1ortalama2< mfrac>s(fark)(n)< /mfrac>< /mstyle>burada:ortalama1 ve ortalama2=Örnek kümelerin her birinin ortalama değerleris </ mi>(diff)= eşleştirilmiş veri değerlerinin farklılıklarının standart sapması< mrow> n= Örnek boyutu (eşleştirilmiş farkların sayısı)</mr ow>n−</ mo>1=Serbestlik dereceleri< annotation encoding="application/x-tex">\begin&T=\frac{\textit1 - \textit2}{\frac{s(\text)} {\sqrt{(n)}}}\&\textbf\&\textit1\text\textit2=\text{Ortalama değerler örnek kümelerin her birinin}\&s(\text)=\text{Eşleştirilmiş veri değerlerinin farklılıklarının standart sapması}\&n=\text{Örnek boyutu (sayı eşleştirilmiş farkların sayısı)}\&n-1=\text\end{hizalanmış}<span class="katex-html " aria -hidden="true">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="vlist-t vlist-t2">T=< /span>(n)<path d='M95,702

c-2.7,0,-7.17,-2.7,-13.5,-8c-5.8,-5.3,-9.5,-10,-9.5,-14

c0,-2,0.3,-3.3,1,-4c1.3,-2.7,23.83,-20.7.67.5,-54

c44.2,-33.3.65.8,-50.3.66.5,-51c1.3,-1.3,3,-2.5,-2c4.7,0,8.7,3.3,12,10

s173.378.173.378c0.7,0,35.3,-71,104,-213c68.7,-142,137.5,-285,206.5,-429

c69,-144,104.5,-217.7,106.5,-221

l0-0

c5.3,-9.3,12,-14,20,-14

H400000v40H845.2724

s-225.272.467,-225.272.467s-235.486,-235.486c-2.7,4.7,-9.7,-19.7

c-6.0,-10,-1,-12,-3s-194,-422,-194,-422s-65.47,-65.47z

M834 80h400000v40h-400000z'/> s(</span span>fark) span> < /span>ortalama1anlamına gelir2< span class="vlist-s"></ span >nerede:< /span>ortalama 1 ve ortalama2=Örnek kümelerin her birinin ortalama değerleris (fark )=Eşleştirilmiş veri değerlerinin farklılıklarının standart sapması n< span class="mrel">=Örnek boyutu (eşleştirilmiş farkların sayısı)n1=Serbestlik dereceleri

Kalan iki tip bağımsız t-testlerine aittir. Bu türlerin örnekleri birbirinden bağımsız olarak seçilir, yani iki gruptaki veri kümeleri aynı değerlere atıfta bulunmaz. Her biri 50 hastadan oluşan iki gruba ayrılan 100 hastadan oluşan bir grup gibi durumları içerir. Gruplardan biri kontrol grubu olur ve plasebo verilir, diğer gruba ise öngörülen tedavi verilir. Bu, birbiriyle eşleştirilmemiş iki bağımsız örnek grubu oluşturur.

Eşit Varyans (veya Havuzlanmış) T-Testi

Eşit varyans t testi, her gruptaki örnek sayısı aynı olduğunda veya iki veri setinin varyansı benzer olduğunda kullanılır. Eşit varyans t-testi için t-değeri ve serbestlik derecelerini hesaplamak için aşağıdaki formül kullanılır:

T-değeri= mean1m< /mi>ean2(n11>×var1< mn>2+(n21)×var22n 1+n22< /mfrac>×1n1+1< /mn>n2 < mstyle scriptlevel="0" displaystyle="true">burada:</ mtr><mstyle scriptlevel="0" displaystyle="true" ">mean1 mn> ve mean2 =Her birinin ortalama değerleri örnek kümelerin sayısıv</ mi>ar1 ve va r2=Örnek kümelerin her birinin varyansı n1 ve n2 =Her örnek setteki kayıt sayısı\begin&\text{T-değeri} = \frac{ ortalama1 - ortalama2 }{\frac {(n1 - 1) \times var12 + (n2 - 1) \times var22 }{ n1 +n2 - 2}\times \sqrt{ \frac{1} + \frac{1}} } \&\textbf\&amp ;mean1 \text ortalama2 = \text{Her birinin ortalama değerleri} \&\text{örnek kümelerin}\&var1 \text var2 = \text{Her birinin varyansı örnek seti s}\&n1 \text n2 = \text{Her örnek setteki kayıt sayısı} \end{hizalı}

l0-0

c4,-6.7,10,-10,18,-10 H400000v40

H1013.1s-83.4.268,-264.1.840c-180.7.572,-277.876.3,-289.913c-4.7.4.7,-12.7.7,-24,7

s-12.0,-12.0c-1.3,-3.3,-3.7,-11.7,-7,-25c-35.3,-125.3,-106.7,-373.3,-214,-744

c-10.12,-21.25,-33.39s-32.39,-32.39c-6,-5.3,-15,-14,-27,-26s25,-30.25,-30

c26.7,-32.7,52,-63.76,-91s52,-60.52,-60s208.722.208.722

c56,-175.3,126.3,-397.3.211,-666c84.7,-268.7.153.8,-488.2.207.5,-658.5

c53.7,-170.3,84.5,-266.8.92.5,-289.5z

M1001 80h400000v40h-400000z'/> < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< span class="mord mathnormal">ean2<​< span class="vlist" style="height:1.73em;"></ span >burada: < /span>mea < span class="mord mathnormal">n1 ve < / span>mean2< span class="mspace" style="margin-right:0.277777777777778em;">=Her bir<span stilinin ortalama değerleri =" top:-1.80572em;">< span class="mord text">örnek kümelerin< span class="pstrut" style="height:3.32144em;">var 1 ve var2= Örnek kümelerin her birinin varyansın1 ve n2= Her örnek setteki kayıt sayısı</ span>

ve,

Özgürlük Dereceleri=n< mn>1+n22 burada:< /mtr>n1 ve n2< /mn>=Her örnek setteki kayıt sayısı</m tr>\begin &\text = n1 + n2 - 2 \ &\textbf\ &n1 \text n2 = \text{Her örnek setteki kayıt sayısı} \ \end{hizalanmış}

Eşit Olmayan Varyans T-Testi

Eşit olmayan varyans t testi, her gruptaki örnek sayısı farklı olduğunda ve iki veri setinin varyansı da farklı olduğunda kullanılır. Bu test aynı zamanda Welch'in t testi olarak da adlandırılır. Eşit olmayan bir varyans t-testi için t-değeri ve serbestlik derecelerini hesaplamak için aşağıdaki formül kullanılır:

T-değeri= mean1m< /mi>ean2<mo çit=" false">(var1 n1+v</ mi>ar2n2< /mrow><mo çit="yanlış">)</ mtr><mstyle scriptlevel="0" displaystyle="true" ">burada: me an1 ve me mi>an2=Her birinin ortalama değerleri< /mstyle> Örnek kümelerden <mtr < mrow >var1 ve < mi >var2=Örnek kümelerin her birinin varyansı< / mtext> n1 ve n2=Sayısı her örnek kümedeki kayıtlar\begin&\text {T-değeri}=\frac{\sqrt{\bigg(\frac{+\frac\bigg))}\&\textbf \&mean1 \text ortalama2 = \text{Her birinin ortalama değerleri} \&\text{örnek kümelerin} \&var1 \text var2 = \text {Örnek kümelerin her birinin varyansı} \&n1 \text n2 = \text{Her bir örnek kümedeki kayıt sayısı} \end{hizalanmış}< /span>< span class="vlist-t vlist-t2">T-değeri< /span>=< span class="vlist-r">( n1 var 1 < /span>+< span class="mfrac">n2< /span>var2 < /span>)<yol d='M473,2793

c339.3,-1799.3,509.3,-2700,510,-2702 l0 -0

c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7

s-90.5,478,-276.2,1466c-185.7.988,-279.5.1483,-281.5,1485c-2.6,-10.9,-24,9

c-8,0,-12,-0.7,-12,-2c0,-1.3,-5.3,-32,-16,-92c-50,7,-293.3,-119.7,-693.3,-207,-1200

c0,-1.3,-5.3,8.7,-16,30c-10.7.21.3,-21.3.42.7,-32.64s-16.33,-16.33s-26,-26,-26,-26

s76,-153.76,-153s77,-151.77,-151c0.7,0.7,35.7.202.105.604c67.3.40.7.102.602.7,104,

606zM1001 80h400000v40H1017.7z'/> < span style="top:-4.064985em;">< span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">−m< span class="mord mathnormal">ean2< span class="vlist" style="height:2.93em;"></ span>burada: mea n1 ve < /span>mean2=Her birinin ortalama değerleri span> örnek kümelerin<span stili<span =" top:0.2942799999999965em;"> var1 ve < /span >v ar2=Örnek kümelerin her birinin varyansın1 ve n2=Her örnek setteki kayıt sayısı

ve,

Özgürlük Dereceleri= <mo çit="true">(var1 2n1 +var22 n2<mo çit="true">)2<mo çit="true">(< mi>var12 n1<mo çit="true">)2n mn>n11 +<mo çit="true">(v mi>ar22n2<mo çit="true">)2n21</ mfrac></ mtd>burada: var1 ve var2=Örnek kümelerin her birinin varyansı n1 ve n< /mi>2=Her örnek setteki kayıt sayısı< /mtable>\begin &\text = \frac{ \left ( \frac{ var12 } + \frac{ var22 } \sağ )2 }{ \frac{ \left ( \frac{ var12 } \sağ )2 }{ n1 - 1 } + \frac{ \left ( \frac { var22 } \right )^2 }{ n2 - 1}} \ &\textbf\ &var1 \text var2 = \text{Her birinin varyansı örnek kümeler} \ &n1 \text n2 = \text{Her bir örnek kümedeki kayıt sayısı} \ \end{hizalı}< span class="katex-html" aria-hidden="true">< /span><​ </sp an>Özgürlük Dereceleri< /span>= </span style="top:-2.655em;"> span>n1< /span>1<span /span>( n1 < span class="pstrut" style="height:3em;">var1< span class="vlist-r">2)2</ span></ span>+n21</ span>(<) span class="mord mtight">n2< /span>var< /span>22 < / span>) < /span>2< /span><​ (n1var1< span class="vlist-r">2 span>​< /span>< /span>+ n2< /span> v</ span>ar2<span class="vlist" " style="height:0.8913142857142857em;"></ span>2 < span>)2 < /span> burada:var< span class="mord">1 ve var2=</ span>Örnek kümelerin her birinin varyansın1 ve < span class="mord mathnormal">n2< span class="mrel">=Her örnek setteki kayıt sayısı<​< span class="vlist-r">< / span>

Kullanılacak Doğru T Testini Belirleme

Numune setlerinin özelliklerine göre hangi t testinin kullanılması gerektiğini belirlemek için aşağıdaki akış şeması kullanılabilir. Göz önünde bulundurulması gereken kilit öğeler, örnek kayıtlarının benzer olup olmadığını, her bir örnek setindeki veri kayıtlarının sayısını ve her bir örnek setinin varyansını içerir.

Eşit Olmayan Varyans T Testi Örneği

Bir sanat galerisinde alınan resimlerin çapraz ölçümünü yaptığımızı varsayalım. Bir grup örnekte 10 resim, diğerinde ise 20 resim bulunmaktadır. Karşılık gelen ortalama ve varyans değerleriyle veri kümeleri aşağıdaki gibidir:

TTT

Set 2'nin ortalaması Set 1'den daha yüksek olmasına rağmen, Set 2'ye karşılık gelen popülasyonun, Set 1'e karşılık gelen popülasyondan daha yüksek bir ortalamaya sahip olduğu sonucuna varamayız. Sanat galerisinde alınan tüm resimlerin genel popülasyonlarında gerçekten farklılıklar var mı? İki örnek kümesi arasında ortalamanın aynı olduğu sıfır hipotezini varsayarak sorunu kurarız ve hipotezin makul olup olmadığını test etmek için bir t testi yaparız.

Veri kayıtlarının sayısı farklı (n1 = 10 ve n2 = 20) ve varyans da farklı olduğundan, yukarıdaki veri seti için Eşit Olmayan Varyans T-Testinde belirtilen formül kullanılarak t değeri ve serbestlik dereceleri hesaplanır. bölüm.

t değeri -2.24787'dir. İki t-değeri karşılaştırılırken eksi işareti yok sayılabileceğinden, hesaplanan değer 2.24787'dir.

Serbestlik derecesi değeri 24.38'dir ve değerin mümkün olan en küçük tamsayı değerine yuvarlanmasını gerektiren formül tanımı nedeniyle 24'e düşürülür.

Kabul için bir kriter olarak bir olasılık seviyesi (alfa seviyesi, anlamlılık seviyesi, p) belirtilebilir. Çoğu durumda, %5'lik bir değer varsayılabilir.

Serbestlik derecesi değeri 24 ve %5 anlamlılık düzeyi kullanılarak t-değeri dağılım tablosuna bakıldığında 2.064 değeri verilmektedir. Bu değerin hesaplanan 2.247 değeriyle karşılaştırılması, hesaplanan t değerinin tablo değerinden %5 anlamlılık düzeyinde daha büyük olduğunu gösterir. Bu nedenle, ortalamalar arasında fark olmadığı sıfır hipotezini reddetmek güvenlidir. Popülasyon kümesinin kendine özgü farklılıkları vardır ve bunlar tesadüfi değildir.

##Öne çıkanlar

  • t-testi, iki grubun ortalamaları arasında belirli özelliklerde ilişkili olabilecek anlamlı bir fark olup olmadığını belirlemek için kullanılan bir tür çıkarımsal istatistiktir.

, istatistikte hipotez testi amacıyla kullanılan birçok testten biridir .

  • Verilere ve gerekli analiz türüne bağlı olarak gerçekleştirilebilecek birkaç farklı t-testi türü vardır.

  • Bir t-testinin hesaplanması, üç temel veri değeri gerektirir. Her bir veri setinden elde edilen ortalama değerler arasındaki farkı (ortalama fark olarak adlandırılır), her grubun standart sapmasını ve her grubun veri değerlerinin sayısını içerirler.