Investor's wiki

Ujian T

Ujian T

Apakah Itu Ujian-T?

Ujian-t ialah sejenis statistik inferensi yang digunakan untuk menentukan sama ada terdapat perbezaan yang signifikan antara min dua kumpulan, yang mungkin berkaitan dalam ciri tertentu. Ia kebanyakannya digunakan apabila set data, seperti set data yang direkodkan sebagai hasil daripada membalikkan syiling sebanyak 100 kali, akan mengikut taburan normal dan mungkin mempunyai varians yang tidak diketahui. Ujian-t digunakan sebagai alat ujian hipotesis, yang membolehkan ujian andaian yang digunakan untuk populasi.

Ujian-t melihat statistik- t, nilai taburan-t,. dan darjah kebebasan untuk menentukan kepentingan statistik. Untuk menjalankan ujian dengan tiga atau lebih cara, seseorang mesti menggunakan analisis varians.

Menjelaskan Ujian-T

Pada asasnya, ujian-t membolehkan kita membandingkan nilai purata kedua-dua set data dan menentukan sama ada ia datang daripada populasi yang sama. Dalam contoh di atas, jika kita mengambil sampel pelajar dari kelas A dan sampel pelajar lain dari kelas B, kita tidak akan menjangkakan mereka mempunyai min dan sisihan piawai yang sama. Begitu juga, sampel yang diambil daripada kumpulan kawalan yang diberi plasebo dan yang diambil daripada kumpulan yang ditetapkan ubat harus mempunyai min dan sisihan piawai yang sedikit berbeza.

Secara matematik, ujian-t mengambil sampel daripada setiap dua set dan menetapkan pernyataan masalah dengan mengandaikan hipotesis nol bahawa kedua-dua min adalah sama. Berdasarkan formula yang berkenaan, nilai tertentu dikira dan dibandingkan dengan nilai piawai, dan hipotesis nol yang diandaikan diterima atau ditolak dengan sewajarnya.

Jika hipotesis nol layak untuk ditolak, ia menunjukkan bahawa bacaan data adalah kuat dan mungkin bukan disebabkan kebetulan.

Ujian-t hanyalah satu daripada banyak ujian yang digunakan untuk tujuan ini. Ahli perangkawan mesti menggunakan ujian selain daripada ujian-t untuk memeriksa lebih banyak pembolehubah dan ujian dengan saiz sampel yang lebih besar. Untuk saiz sampel yang besar, ahli statistik menggunakan ujian-z. Pilihan ujian lain termasuk ujian khi kuasa dua dan ujian f.

Terdapat tiga jenis ujian-t, dan ia dikategorikan sebagai ujian-t bergantung dan bebas.

Keputusan Ujian Samar-samar

Pertimbangkan bahawa pengeluar ubat ingin menguji ubat yang baru dicipta. Ia mengikut prosedur standard untuk mencuba ubat pada satu kumpulan pesakit dan memberikan plasebo kepada kumpulan lain, dipanggil kumpulan kawalan. Plasebo yang diberikan kepada kumpulan kawalan adalah bahan yang tidak mempunyai nilai terapeutik yang dimaksudkan dan berfungsi sebagai penanda aras untuk mengukur bagaimana kumpulan lain, yang diberi ubat sebenar, bertindak balas.

Selepas percubaan dadah, ahli kumpulan kawalan yang diberi plasebo melaporkan peningkatan purata jangka hayat selama tiga tahun, manakala ahli kumpulan yang diberi ubat baru melaporkan peningkatan purata jangka hayat selama empat tahun. Pemerhatian segera mungkin menunjukkan bahawa ubat itu memang berkesan kerana hasilnya lebih baik untuk kumpulan yang menggunakan dadah. Walau bagaimanapun, mungkin juga pemerhatian itu mungkin disebabkan oleh kejadian kebetulan, terutamanya nasib yang mengejutkan. Ujian-t berguna untuk membuat kesimpulan jika keputusan itu benar-benar betul dan boleh digunakan untuk keseluruhan populasi.

Di sebuah sekolah, 100 pelajar kelas A mendapat purata 85% dengan sisihan piawai 3%. 100 lagi pelajar kelas B mendapat purata 87% dengan sisihan piawai 4%. Walaupun purata kelas B adalah lebih baik daripada kelas A, mungkin tidak tepat untuk membuat kesimpulan bahawa prestasi keseluruhan pelajar dalam kelas B adalah lebih baik daripada pelajar kelas A. Ini kerana terdapat kebolehubahan semula jadi. dalam markah ujian dalam kedua-dua kelas, jadi perbezaan itu mungkin disebabkan oleh kebetulan sahaja. Ujian-t boleh membantu untuk menentukan sama ada satu kelas bernasib baik daripada kelas yang lain.

Andaian Ujian-T

  1. Andaian pertama yang dibuat berkenaan ujian-t melibatkan skala pengukuran. Andaian untuk ujian-t ialah skala pengukuran yang digunakan pada data yang dikumpul mengikut skala berterusan atau ordinal, seperti markah untuk ujian IQ.

  2. Andaian kedua yang dibuat ialah sampel rawak mudah, bahawa data dikumpul daripada wakil, bahagian yang dipilih secara rawak daripada jumlah populasi.

  3. Andaian ketiga ialah data, apabila diplot, menghasilkan taburan normal, keluk taburan berbentuk loceng.

  4. Andaian terakhir ialah kehomogenan varians. Varians homogen, atau sama, wujud apabila sisihan piawai sampel adalah lebih kurang sama.

Mengira Ujian-T

Mengira ujian-t memerlukan tiga nilai data utama. Ia termasuk perbezaan antara nilai min daripada setiap set data (dipanggil perbezaan min), sisihan piawai setiap kumpulan, dan bilangan nilai data setiap kumpulan.

Hasil ujian-t menghasilkan nilai-t. Nilai-t yang dikira ini kemudiannya dibandingkan dengan nilai yang diperoleh daripada jadual nilai kritikal (dipanggil Jadual Taburan T). Perbandingan ini membantu untuk menentukan kesan peluang sahaja terhadap perbezaan, dan sama ada perbezaan itu berada di luar julat peluang tersebut. Soalan ujian-t sama ada perbezaan antara kumpulan mewakili perbezaan sebenar dalam kajian atau jika ia mungkin perbezaan rawak yang tidak bermakna.

Jadual Taburan T

Jadual T-Distribution tersedia dalam format satu ekor dan dua ekor . Yang pertama digunakan untuk menilai kes yang mempunyai nilai atau julat tetap dengan arah yang jelas (positif atau negatif). Sebagai contoh, apakah kebarangkalian nilai keluaran yang tinggal di bawah -3, atau mendapat lebih daripada tujuh apabila membaling sepasang dadu? Yang terakhir digunakan untuk analisis sempadan julat, seperti bertanya sama ada koordinat jatuh antara -2 dan +2.

Pengiraan boleh dilakukan dengan program perisian standard yang menyokong fungsi statistik yang diperlukan, seperti yang terdapat dalam MS Excel.

Nilai-T dan Darjah Kebebasan

Ujian-t menghasilkan dua nilai sebagai outputnya: nilai-t dan darjah kebebasan. Nilai-t ialah nisbah perbezaan antara min dua set sampel dan variasi yang wujud dalam set sampel. Walaupun nilai pengangka (perbezaan antara min bagi dua set sampel) adalah mudah untuk dikira, penyebut (variasi yang wujud dalam set sampel) boleh menjadi agak rumit bergantung pada jenis nilai data yang terlibat. Penyebut nisbah ialah ukuran serakan atau kebolehubahan. Nilai-nilai yang lebih tinggi daripada nilai-t, juga dipanggil skor-t, menunjukkan bahawa terdapat perbezaan yang besar antara kedua-dua set sampel. Lebih kecil nilai-t, lebih banyak persamaan wujud antara dua set sampel.

  • Skor-t yang besar menunjukkan bahawa kumpulan adalah berbeza.

  • Skor-t kecil menunjukkan bahawa kumpulan adalah serupa.

Darjah kebebasan merujuk kepada nilai dalam kajian yang mempunyai kebebasan untuk berubah-ubah dan penting untuk menilai kepentingan dan kesahihan hipotesis nol. Pengiraan nilai ini biasanya bergantung pada bilangan rekod data yang tersedia dalam set sampel.

Ujian-T Berkorelasi (atau Berpasangan).

Ujian-t berkorelasi dilakukan apabila sampel biasanya terdiri daripada pasangan padan unit yang serupa, atau apabila terdapat kes langkah berulang. Sebagai contoh, mungkin terdapat keadaan pesakit yang sama diuji berulang kaliβ€”sebelum dan selepas menerima rawatan tertentu. Dalam kes sedemikian, setiap pesakit digunakan sebagai sampel kawalan terhadap diri mereka sendiri.

Kaedah ini juga digunakan untuk kes di mana sampel berkaitan dalam beberapa cara atau mempunyai ciri padanan, seperti analisis perbandingan yang melibatkan kanak-kanak, ibu bapa atau adik-beradik. Ujian-t berkorelasi atau berpasangan adalah daripada jenis bergantung, kerana ini melibatkan kes di mana dua set sampel adalah berkaitan.

Formula untuk mengira nilai-t dan darjah kebebasan untuk ujian-t berpasangan ialah:

T=min1βˆ’min2< mfrac>s(diff)(n)< /mfrac>< /mstyle>di mana:min1 dan min2=</ mo>Nilai purata setiap set sampels </ mi>(diff)=The sisihan piawai bagi perbezaan nilai data berpasangan< mrow> n= Saiz sampel (bilangan perbezaan berpasangan)</mr ow>nβˆ’</ mo>1=Dasar kebebasan< pengekodan anotasi="application/x-tex">\begin&T=\frac{\textit1 - \textit2}{\frac{s(\text)} {\sqrt{(n)}}}\&\textbf\&\textit1\text\textit2=\text\&s(\text)=\text\&n=\text{Saiz sampel (nombor perbezaan berpasangan)}\&n-1=\text\end<span class="katex-html " aria -hidden="true">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="mord">< span class="vlist-t vlist-t2">T=< /span>(n)<svg width='400em' height='1.5428571428571431em' viewBox='0 0 400000 1080' preserveAspectNisbah='xMinthdMinY70 slice='xpa5MinY70'

c-2.7,0,-7.17,-2.7,-13.5,-8c-5.8,-5.3,-9.5,-10,-9.5,-14

c0,-2,0.3,-3.3,1,-4c1.3,-2.7,23.83,-20.7,67.5,-54

c44.2,-33.3,65.8,-50.3,66.5,-51c1.3,-1.3,3,-2.5,-2c4.7,0,8.7,3.3,12,10

s173,378,173,378c0.7,0,35.3,-71,104,-213c68.7,-142,137.5,-285,206.5,-429

c69,-144,104.5,-217.7,106.5,-221

l0-0

c5.3,-9.3,12,-14,20,-14

H400000v40H845.2724

s-225.272.467,-225.272.467s-235.486,-235.486c-2.7,4.7,-9.7,-19.7

c-6.0,-10,-1,-12,-3s-194,-422,-194,-422s-65.47,-65.47z

M834 80h400000v40h-400000z'/>​ s(</ span>perbezaan)</ span> < /span></ span>min1βˆ’min2< span class="vlist-s"></ span >di mana:< /span>min 1 dan min2</ span>=Nilai purata setiap set sampels (perbezaan )=Sisihan piawai bagi perbezaan nilai data berpasangan n< span class="mrel">=Saiz sampel (bilangan perbezaan berpasangan)nβˆ’1=Dasar kebebasan

Baki dua jenis tergolong dalam ujian-t bebas. Sampel jenis ini dipilih secara bebas antara satu sama lainβ€”iaitu, set data dalam dua kumpulan tidak merujuk kepada nilai yang sama. Ia termasuk kes seperti sekumpulan 100 pesakit yang dibahagikan kepada dua set 50 pesakit setiap satu. Satu daripada kumpulan menjadi kumpulan kawalan dan diberi plasebo, manakala kumpulan lain menerima rawatan yang ditetapkan. Ini membentuk dua kumpulan sampel bebas yang tidak berpasangan antara satu sama lain.

Ujian T Varians Sama (atau Disatukan).

Ujian-t varians sama digunakan apabila bilangan sampel dalam setiap kumpulan adalah sama, atau varians kedua-dua set data adalah serupa. Formula berikut digunakan untuk mengira nilai-t dan darjah kebebasan untuk ujian-t varians yang sama:

T-value= mean1βˆ’m< /mi>ean2(n1βˆ’1)Γ—var1< mn>2+(n2βˆ’1)Γ—var22n 1+n2βˆ’2< /mfrac>Γ—1n1+1< /mn>n2 < mstyle scriptlevel="0" displaystyle="true">di mana:</ mtr>mean1</ mn> dan mean2 =Nilai purata bagi setiap daripada set sampelv</ mi>ar1 dan va r2=Variasi setiap set sampel n1 dan n2 =Bilangan rekod dalam setiap set sampel\begin&\text = \frac{ mean1 - mean2 }{\frac {(n1 - 1) \times var12 + (n2 - 1) \times var22 }{ n1 +n2 - 2}\times \sqrt{ \frac{1} + \frac{1}} } \&\textbf\&amp ;min1 \text min2 = \text \&\text\&var1 \text var2 = \text\&n1 \text n2 = \text \end

l0-0

c4,-6.7,10,-10,18,-10 H400000v40

H1013.1s-83.4.268,-264.1,840c-180.7.572,-277.876.3,-289.913c-4.7.4.7,-12.7.7,-24.7

s-12.0,-12.0c-1.3,-3.3,-3.7,-11.7,-7,-25c-35.3,-125.3,-106.7,-373.3,-214,-744

c-10.12,-21.25,-33.39s-32.39,-32.39c-6,-5.3,-15,-14,-27,-26s25,-30.25,-30

c26.7,-32.7,52,-63.76,-91s52,-60.52,-60s208,722,208,722

c56,-175.3,126.3,-397.3,211,-666c84.7,-268.7,153.8,-488.2,207.5,-658.5

c53.7,-170.3,84.5,-266.8,92.5,-289.5z

M1001 80h400000v40h-400000z'/>​ < span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">βˆ’m< span class="mord mathnormal">ean2<​< span class="vlist" style="height:1.73em;"></ span >di mana: < /span>mea < span class="mord mathnormal">n1 dan < / span>mean2< span class="mspace" style="margin-right:0.2777777777777778em;">=Nilai purata setiap< span class="mord text">daripada set sampel< span class="pstrut" style="height:3.32144em;">var 1 dan var2= Variasi setiap set sampeln1 dan n2= Bilangan rekod dalam setiap set sampel span>

dan,

Dasar Kebebasan=n< mn>1+n2βˆ’2 di mana:< /mtr>n1 dan n2< /mn>=Bilangan rekod dalam setiap set sampel</m tr>\begin &\text = n1 + n2 - 2 \ &\textbf\ &n1 \text n2 = \text \ \end

Ujian T Varians Tidak Sama

Ujian-t varians tidak sama digunakan apabila bilangan sampel dalam setiap kumpulan adalah berbeza, dan varians kedua-dua set data juga berbeza. Ujian ini juga dipanggil ujian-t Welch. Formula berikut digunakan untuk mengira nilai-t dan darjah kebebasan untuk ujian-t varians tidak sama:

T-value= mean1βˆ’m< /mi>ean2(var1 n1+v</ mi>ar2n2< /mrow>)</ mtr>di mana: me an1 dan me</ mi>an2=Nilai purata setiap< /mstyle> daripada set sampel <mtr < mrow >var1 dan < mi >var2=Varian setiap set sampel< / mtext> n1 dan n2=Bilangan rekod dalam setiap set sampel\begin&\text =\frac{\sqrt{\bigg(\frac{+\frac\bigg)))}\&\textbf \&min1 \text min2 = \text \&\text \&var1 \text var2 = \text \&n1 \text n2 = \text \end< /span>< span class="vlist-t vlist-t2">Nilai-T< /span>=< span class="vlist-r">( n1 var 1​ < /span>+< span class="mfrac">n2< /span>var2 < /span>)<path d='M473,2793

c339.3,-1799.3,509.3,-2700,510,-2702 l0 -0

c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7

s-90.5,478,-276.2,1466c-185.7,988,-279.5,1483,-281.5,1485c-2.6,-10.9,-24.9

c-8,0,-12,-0.7,-12,-2c0,-1.3,-5.3,-32,-16,-92c-50.7,-293.3,-119.7,-693.3,-207,-1200

c0,-1.3,-5.3,8.7,-16,30c-10.7,21.3,-21.3,42.7,-32.64s-16.33,-16.33s-26,-26,-26,-26

s76,-153.76,-153s77,-151.77,-151c0.7,0.7,35.7,202,105,604c67.3,400.7,102,602.7,104,

606zM1001 80h400000v40H1017.7z'/> < span style="top:-4.064985em;">< span class="mord">mea< span class="mord mathnormal">n1< span class="mbin">βˆ’m< span class="mord mathnormal">ean2​< span class="vlist" style="height:2.93em;"></ span>di mana: mea n1 dan < /span>mean2=Nilai purata bagi setiap</ span> daripada set sampel var1 dan < /span >v ar2=</ span>Variasi setiap set sampeln1 dan n2=Bilangan rekod dalam setiap set sampel

dan,

Tahap Kebebasan= (var1 2n1 +var22 n2)</ mo>2(< mi>var12 n1)2</ mn>n1βˆ’1 +(v</ mi>ar22n2)2n2βˆ’1</ mfrac></ mtd>di mana: var1 dan var2=Variasi setiap set sampel n1 dan n< /mi>2=Bilangan rekod dalam setiap set sampel< /mtable>\begin &\text = \frac{ \left ( \frac{ var12 } + \frac{ var22 } \kanan )2 }{ \frac{ \left ( \frac{ var12 } \right )2 }{ n1 - 1 } + \frac{ \left ( \frac { var22 } \kanan )^2 }{ n2 - 1}} \ &\textbf\ &var1 \text var2 = \text \ &n1 \text n2 = \text \ \end< span class="katex-html" aria-hidden="true">< /span><​ </sp an>Darjah Kebebasan< /span>= </ span>n1< /span>βˆ’1< /span>( n1 < span class="pstrut" style="height:3em;">var1< span class="vlist-r">2​)<span class="pstrut" style="pstrut" "height:2.5em;">2​</ span></ span>+n2βˆ’1</ span>(< span class="mord mtight">n2< /span>var< /span>22 < / span>) < /span><s" classes style="height:2.5em;">2< /span><​ (n1var1< span class="vlist-r">2</ span>​< /span>< /span>+ n2< /span> v</ span>ar2</ span>2 < span>)2 < /span>​ di mana:var< span class="mord">1 dan var</ span>2=</ span>Variasi setiap set sampeln1 dan < span class="mord mathnormal">n2< span class="mrel">=Bilangan rekod dalam setiap set sampel<​< span class="vlist-r">< / span>

Menentukan Ujian-T yang Betul untuk Digunakan

Carta alir berikut boleh digunakan untuk menentukan ujian-t yang harus digunakan berdasarkan ciri-ciri set sampel. Perkara utama yang perlu dipertimbangkan termasuk sama ada rekod sampel adalah serupa, bilangan rekod data dalam setiap set sampel dan varians setiap set sampel.

Contoh Ujian T Varians Tidak Sama

Andaikan kita sedang mengambil ukuran pepenjuru bagi lukisan yang diterima di galeri seni. Satu kumpulan sampel termasuk 10 lukisan, manakala satu lagi termasuk 20 lukisan. Set data, dengan nilai min dan varians yang sepadan, adalah seperti berikut:

TTT

Walaupun min Set 2 adalah lebih tinggi daripada Set 1, kita tidak boleh membuat kesimpulan bahawa populasi yang sepadan dengan Set 2 mempunyai min yang lebih tinggi daripada populasi yang sepadan dengan Set 1. Adakah perbezaan dari 19.4 hingga 21.6 disebabkan oleh kebetulan sahaja, atau melakukan perbezaan benar-benar wujud dalam populasi keseluruhan semua lukisan yang diterima di galeri seni? Kami mewujudkan masalah dengan mengandaikan hipotesis nol bahawa min adalah sama antara dua set sampel dan menjalankan ujian-t untuk menguji sama ada hipotesis itu munasabah.

Oleh kerana bilangan rekod data adalah berbeza (n1 = 10 dan n2 = 20) dan varians juga berbeza, nilai-t dan darjah kebebasan dikira untuk set data di atas menggunakan formula yang disebut dalam Ujian T Varians Tidak Sama. bahagian.

Nilai-t ialah -2.24787. Oleh kerana tanda tolak boleh diabaikan apabila membandingkan dua nilai-t, nilai yang dikira ialah 2.24787.

Nilai darjah kebebasan ialah 24.38 dan dikurangkan kepada 24, disebabkan takrifan formula yang memerlukan pembundaran ke bawah nilai kepada nilai integer paling kecil yang mungkin.

Seseorang boleh menentukan tahap kebarangkalian (tahap alfa, tahap keertian, p) sebagai kriteria untuk penerimaan. Dalam kebanyakan kes, nilai 5% boleh diandaikan.

Menggunakan nilai darjah kebebasan sebagai 24 dan tahap keertian 5%, melihat jadual taburan nilai-t memberikan nilai 2.064. Membandingkan nilai ini dengan nilai pengiraan 2.247 menunjukkan bahawa nilai-t yang dikira adalah lebih besar daripada nilai jadual pada aras keertian 5%. Oleh itu, adalah selamat untuk menolak hipotesis nol bahawa tiada perbezaan antara min. Set populasi mempunyai perbezaan intrinsik, dan mereka bukan secara kebetulan.

##Sorotan

  • Ujian-t ialah sejenis statistik inferensi yang digunakan untuk menentukan sama ada terdapat perbezaan yang signifikan antara min dua kumpulan, yang mungkin berkaitan dalam ciri tertentu.

  • Ujian-t adalah salah satu daripada banyak ujian yang digunakan untuk tujuan ujian hipotesis dalam statistik.

  • Terdapat beberapa jenis ujian-t yang boleh dilakukan bergantung kepada data dan jenis analisis yang diperlukan.

  • Mengira ujian-t memerlukan tiga nilai data utama. Ia termasuk perbezaan antara nilai min daripada setiap set data (dipanggil perbezaan min), sisihan piawai setiap kumpulan, dan bilangan nilai data setiap kumpulan.