Kebaikan-of-Fit

Apakah Kebaikan-kesesuaian?

Istilah goodness-of-fit merujuk kepada ujian statistik yang menentukan sejauh mana data sampel padan dengan taburan daripada populasi dengan taburan normal. Ringkasnya, ia membuat hipotesis sama ada sampel miring atau mewakili data yang anda jangkakan dapati dalam populasi sebenar.

Kebaikan-kesesuaian mewujudkan percanggahan antara nilai yang diperhatikan dan yang diharapkan daripada model dalam kes pengedaran normal. Terdapat pelbagai kaedah untuk menentukan kesesuaian, termasuk khi kuasa dua.

Memahami Kebaikan-Kesesuaian

Ujian kesesuaian ialah kaedah statistik yang membuat inferens tentang nilai yang diperhatikan. Sebagai contoh, anda boleh menentukan sama ada kumpulan sampel benar-benar mewakili keseluruhan populasi. Oleh itu, mereka menentukan bagaimana nilai sebenar berkaitan dengan nilai yang diramalkan dalam model. Apabila digunakan dalam membuat keputusan, ujian kesesuaian menjadikannya lebih mudah untuk meramalkan arah aliran dan corak pada masa hadapan.

Seperti yang dinyatakan di atas, terdapat beberapa jenis ujian kesesuaian. Ia termasuk ujian khi kuasa dua, yang paling biasa, serta ujian Kolmogorov-Smirnov, dan ujian Shipiro-Wilk. Ujian biasanya dijalankan menggunakan perisian komputer. Tetapi ahli statistik boleh melakukan ujian ini menggunakan formula yang disesuaikan dengan jenis ujian tertentu.

Untuk menjalankan ujian, anda memerlukan pembolehubah tertentu, bersama-sama dengan andaian bagaimana ia diedarkan. Anda juga memerlukan set data dengan nilai yang jelas dan eksplisit, seperti:

Nilai yang diperhatikan, yang diperoleh daripada set data sebenar
Nilai jangkaan, yang diambil daripada andaian yang dibuat
Jumlah bilangan kategori dalam set

Ujian kesesuaian biasanya digunakan untuk menguji kenormalan sisa atau untuk menentukan sama ada dua sampel dikumpulkan daripada taburan yang sama.

Pertimbangan Khas

Untuk mentafsir ujian kesesuaian, adalah penting bagi ahli statistik untuk mewujudkan tahap alfa, seperti nilai p untuk ujian khi kuasa dua. Nilai-p merujuk kepada kebarangkalian mendapat keputusan yang hampir dengan keterlaluan keputusan yang diperhatikan. Ini mengandaikan bahawa hipotesis nol adalah betul. Hipotesis nol menegaskan tidak ada hubungan yang wujud antara pembolehubah, dan hipotesis alternatif menganggap bahawa hubungan wujud.

Sebaliknya, kekerapan nilai yang diperhatikan diukur dan seterusnya digunakan dengan nilai yang dijangkakan dan darjah kebebasan untuk mengira khi kuasa dua. Jika keputusannya lebih rendah daripada alfa, hipotesis nol adalah tidak sah, menunjukkan wujud hubungan antara pembolehubah.

Jenis Ujian Kebaikan-kecergasan

Ujian Khi Kuasa Dua

$\chi$

Ujian khi kuasa dua,. yang juga dikenali sebagai ujian khi kuasa dua untuk kebebasan, ialah kaedah statistik inferensi yang menguji kesahihan tuntutan yang dibuat tentang populasi berdasarkan sampel rawak.

Digunakan secara eksklusif untuk data yang diasingkan ke dalam kelas (tong), ia memerlukan saiz sampel yang mencukupi untuk menghasilkan keputusan yang tepat. Tetapi ia tidak menunjukkan jenis atau keamatan hubungan. Sebagai contoh, ia tidak membuat kesimpulan sama ada hubungan itu positif atau negatif.

Untuk mengira kebaikan khi kuasa dua, tetapkan tahap keertian alfa yang diingini. Jadi jika tahap keyakinan anda ialah 95% (atau 0.95), maka alfa ialah 0.05. Seterusnya, kenal pasti pembolehubah kategori untuk diuji, kemudian tentukan pernyataan hipotesis tentang hubungan antara mereka.

Pembolehubah mestilah saling eksklusif untuk melayakkan diri untuk ujian khi kuasa dua untuk kebebasan. Dan ujian chi goodness-of-fit tidak boleh digunakan untuk data yang berterusan.

Ujian Kolmogorov-Smirnov

$D=\max\limits_{ 1\leq i\leq N}\bigg(F(Y_i)-\frac,\frac-F(Y_i)\bigg)$ (F(Y i)−Ni−1 ~~,Ni−F( Yi))~~

Dinamakan sempena ahli matematik Rusia Andrey Kolmogorov dan Nikolai Smirnov, ujian Kolmogorov-Smirnov (juga dikenali sebagai ujian KS) ialah kaedah statistik yang menentukan sama ada sampel adalah daripada taburan tertentu dalam populasi.

Ujian ini, yang disyorkan untuk sampel besar (cth, lebih 2000), adalah bukan parametrik. Ini bermakna ia tidak bergantung pada sebarang pengedaran untuk sah. Matlamatnya adalah untuk membuktikan hipotesis nol, yang merupakan sampel taburan normal.

Seperti khi kuasa dua, ia menggunakan hipotesis nol dan alternatif serta tahap keertian alfa. Null menunjukkan bahawa data mengikut taburan tertentu dalam populasi, dan alternatif menunjukkan bahawa data tidak mengikuti taburan tertentu dalam populasi. Alfa digunakan untuk menentukan nilai kritikal yang digunakan dalam ujian. Tetapi tidak seperti ujian khi kuasa dua, ujian Kolmogorov-Smirnov digunakan untuk pengagihan berterusan.

Statistik ujian yang dikira selalunya dilambangkan sebagai D. Ia menentukan sama ada hipotesis nol diterima atau ditolak. Jika D lebih besar daripada nilai kritikal pada alpha,. hipotesis nol ditolak. Jika D kurang daripada nilai kritikal, hipotesis nol diterima.

Ujian Shipiro-Wilk

$W=\frac{\big(\sum^n_a_i(x_{(i)}\big)$ ,

Ujian Shipiro-Wilk menentukan sama ada sampel mengikut taburan normal. Ujian ini hanya menyemak kenormalan apabila menggunakan sampel dengan satu pembolehubah data berterusan dan disyorkan untuk saiz sampel kecil sehingga 2000.

Ujian Shipiro-Wilk menggunakan plot kebarangkalian yang dipanggil Plot QQ, yang memaparkan dua set kuantil pada paksi-y yang disusun daripada terkecil kepada terbesar. Jika setiap kuantil datang daripada taburan yang sama, siri plot adalah linear.

Plot QQ digunakan untuk menganggar varians. Menggunakan varians Plot QQ bersama-sama dengan varians anggaran populasi, seseorang boleh menentukan sama ada sampel tergolong dalam taburan normal. Jika hasil bagi kedua-dua varians sama atau hampir dengan 1, hipotesis nol boleh diterima. Jika jauh lebih rendah daripada 1, ia boleh ditolak.

Sama seperti ujian yang dinyatakan di atas, ujian ini menggunakan alfa dan membentuk dua hipotesis: nol dan alternatif. Hipotesis nol menyatakan bahawa sampel berasal daripada taburan normal, manakala hipotesis alternatif menyatakan bahawa sampel tidak datang daripada taburan normal.

Contoh Kebaikan yang Sesuai

Berikut ialah contoh hipotetikal untuk menunjukkan cara ujian kesesuaian berfungsi.

Katakan sebuah gim komuniti kecil beroperasi dengan andaian bahawa kehadiran tertinggi ialah pada hari Isnin, Selasa dan Sabtu, purata kehadiran pada hari Rabu dan Khamis, dan kehadiran terendah pada hari Jumaat dan Ahad. Berdasarkan andaian ini, gim menggunakan sebilangan kakitangan setiap hari untuk mendaftar masuk ahli, kemudahan bersih, menawarkan perkhidmatan latihan dan mengajar kelas.

Tetapi gim tidak menunjukkan prestasi yang baik dari segi kewangan dan pemilik ingin tahu sama ada andaian kehadiran dan tahap kakitangan ini betul. Pemilik memutuskan untuk mengira bilangan peserta gim setiap hari selama enam minggu. Mereka kemudiannya boleh membandingkan kehadiran andaian gim dengan kehadiran yang diperhatikan menggunakan ujian khi kuasa dua kebaikan-kesesuaian sebagai contoh.

Memandangkan mereka mempunyai data baharu, mereka boleh menentukan cara terbaik untuk mengurus gim dan meningkatkan keuntungan.

Garisan bawah

Ujian kesesuaian menentukan sejauh mana data sampel sesuai dengan apa yang diharapkan daripada populasi. Daripada data sampel, nilai yang diperhatikan dikumpul dan dibandingkan dengan nilai jangkaan yang dikira menggunakan ukuran percanggahan. Terdapat pelbagai ujian hipotesis kesesuaian yang tersedia bergantung pada hasil yang anda cari.

Memilih ujian kesesuaian yang betul bergantung pada perkara yang anda ingin ketahui tentang sampel dan saiz sampel. Sebagai contoh, jika ingin mengetahui sama ada nilai yang diperhatikan untuk data kategori sepadan dengan nilai yang dijangkakan untuk data kategori, gunakan khi kuasa dua. Jika ingin mengetahui sama ada sampel kecil mengikut taburan normal, ujian Shipiro-Wilk mungkin berfaedah. Terdapat banyak ujian yang tersedia untuk menentukan kebaikan-kesesuaian.

Sorotan

Kebaikan-kesesuaian ialah ujian statistik yang cuba menentukan sama ada satu set nilai yang diperhatikan sepadan dengan yang dijangkakan di bawah model yang berkenaan.

Mereka boleh menunjukkan kepada anda sama ada data sampel anda sesuai dengan set data yang dijangkakan daripada populasi dengan taburan normal.

Ujian khi kuasa dua menentukan sama ada wujud hubungan antara data kategori.

Terdapat pelbagai jenis ujian kesesuaian, tetapi yang paling biasa ialah ujian khi kuasa dua.

Ujian Kolmogorov-Smirnov menentukan sama ada sampel datang daripada taburan tertentu populasi.

Soalan Lazim

Apakah Goodness-of-Fit dalam Ujian Chi-Square?

Ujian khi kuasa dua sama ada wujud hubungan antara pembolehubah kategori dan sama ada sampel mewakili keseluruhan. Ia menganggarkan sejauh mana data yang diperhatikan mencerminkan data yang dijangkakan, atau sejauh mana ia sesuai.

Apakah Maksud Kebaikan-kesesuaian?

Goodness-of-Fit ialah ujian hipotesis statistik yang digunakan untuk melihat sejauh mana data yang diperhatikan dengan teliti mencerminkan data yang dijangkakan. Ujian Goodness-of-Fit boleh membantu menentukan sama ada sampel mengikut taburan normal, jika pembolehubah kategori berkaitan, atau jika sampel rawak adalah daripada taburan yang sama.

Bagaimana Anda Melakukan Ujian Kebaikan-kecergasan?

Ujian Goodness-of-FIt terdiri daripada kaedah ujian yang berbeza. Matlamat ujian akan membantu menentukan kaedah yang hendak digunakan. Sebagai contoh, jika matlamatnya adalah untuk menguji kenormalan pada sampel yang agak kecil, ujian Shipiro-Wilk mungkin sesuai. Jika ingin menentukan sama ada sampel datang daripada taburan tertentu dalam populasi, ujian Kolmogorov-Smirnov akan digunakan. Setiap ujian menggunakan formula uniknya sendiri. Walau bagaimanapun, mereka mempunyai persamaan, seperti hipotesis nol dan tahap kepentingan.

Mengapa Kebaikan-kesesuaian Penting?

Ujian Goodness-of-Fit membantu menentukan sama ada data yang diperhatikan sejajar dengan apa yang dijangkakan. Keputusan boleh dibuat berdasarkan keputusan ujian hipotesis yang dijalankan. Sebagai contoh, peruncit ingin mengetahui tawaran produk yang menarik minat golongan muda. Peruncit meninjau sampel rawak orang tua dan muda untuk mengenal pasti produk mana yang diutamakan. Menggunakan khi kuasa dua, mereka mengenal pasti bahawa, dengan keyakinan 95%, wujud hubungan antara produk A dan golongan muda. Berdasarkan keputusan ini, dapat ditentukan bahawa sampel ini mewakili populasi dewasa muda. Pemasar runcit boleh menggunakan ini untuk memperbaharui kempen mereka.