Analisis Varians (ANOVA)
Apakah itu Analisis Varians (ANOVA)?
Analisis varians (ANOVA) ialah alat analisis yang digunakan dalam statistik yang membahagikan kebolehubahan agregat yang diperhatikan yang terdapat dalam set data kepada dua bahagian: faktor sistematik dan faktor rawak. Faktor sistematik mempunyai pengaruh statistik pada set data yang diberikan, manakala faktor rawak tidak. Penganalisis menggunakan ujian ANOVA untuk menentukan pengaruh pembolehubah bebas terhadap pembolehubah bersandar dalam kajian regresi.
t dan z yang dibangunkan pada abad ke-20 digunakan untuk analisis statistik sehingga 1918, apabila Ronald Fisher mencipta kaedah analisis varians. ANOVA juga dipanggil analisis varians Fisher, dan ia adalah lanjutan daripada ujian-t dan z. Istilah ini menjadi terkenal pada tahun 1925, selepas muncul dalam buku Fisher, "Kaedah Statistik untuk Pekerja Penyelidik." Ia digunakan dalam psikologi eksperimen dan kemudiannya diperluaskan kepada subjek yang lebih kompleks.
Formula untuk ANOVA ialah:
Apakah yang Didedahkan oleh Analisis Varians?
Ujian ANOVA adalah langkah awal dalam menganalisis faktor yang mempengaruhi set data yang diberikan. Setelah ujian selesai, seorang penganalisis melakukan ujian tambahan ke atas faktor berkaedah yang menyumbang kepada ketidakkonsistenan set data yang boleh diukur. Penganalisis menggunakan keputusan ujian ANOVA dalam ujian-f untuk menjana data tambahan yang sejajar dengan model regresi yang dicadangkan.
Ujian ANOVA membolehkan perbandingan lebih daripada dua kumpulan pada masa yang sama untuk menentukan sama ada wujud hubungan antara mereka. Hasil daripada formula ANOVA, statistik F (juga dipanggil nisbah-F), membolehkan analisis berbilang kumpulan data untuk menentukan kebolehubahan antara sampel dan dalam sampel.
Jika tiada perbezaan nyata wujud antara kumpulan yang diuji, yang dipanggil hipotesis nol,. keputusan statistik nisbah-F ANOVA akan hampir kepada 1. Taburan semua nilai yang mungkin bagi statistik F ialah taburan-F. Ini sebenarnya sekumpulan fungsi taburan, dengan dua nombor ciri, dipanggil darjah kebebasan pengangka dan darjah kebebasan penyebut.
Contoh Cara Menggunakan ANOVA
Seorang penyelidik mungkin, sebagai contoh, menguji pelajar dari pelbagai kolej untuk melihat sama ada pelajar dari salah satu kolej secara konsisten mengatasi pelajar dari kolej lain. Dalam aplikasi perniagaan, penyelidik R&D mungkin menguji dua proses yang berbeza untuk mencipta produk untuk melihat sama ada satu proses lebih baik daripada yang lain dari segi kecekapan kos.
Jenis ujian ANOVA yang digunakan bergantung kepada beberapa faktor. Ia digunakan apabila data perlu eksperimen. Analisis varians digunakan jika tiada akses kepada perisian statistik yang mengakibatkan pengiraan ANOVA dengan tangan. Ia mudah digunakan dan paling sesuai untuk sampel kecil. Dengan banyak reka bentuk eksperimen, saiz sampel mestilah sama untuk pelbagai kombinasi peringkat faktor.
ANOVA berguna untuk menguji tiga atau lebih pembolehubah. Ia serupa dengan ujian-t dua sampel. Walau bagaimanapun, ia menghasilkan lebih sedikit ralat jenis I dan sesuai untuk pelbagai isu. ANOVA mengumpulkan perbezaan dengan membandingkan cara setiap kumpulan dan termasuk menyebarkan varians ke dalam pelbagai sumber. Ia digunakan dengan subjek, kumpulan ujian, antara kumpulan dan dalam kumpulan.
ANOVA Sehala Berbanding ANOVA Dua Hala
Terdapat dua jenis utama ANOVA: sehala (atau satu arah) dan dua hala. Terdapat juga variasi ANOVA. Sebagai contoh, MANOVA (ANOVA berbilang) berbeza daripada ANOVA kerana ujian terdahulu untuk pelbagai pembolehubah bersandar secara serentak manakala yang terakhir menilai hanya satu pembolehubah bersandar pada satu masa. Sehala atau dua hala merujuk kepada bilangan pembolehubah bebas dalam analisis ujian varians anda. ANOVA sehala menilai kesan faktor tunggal ke atas pembolehubah tindak balas tunggal. Ia menentukan sama ada semua sampel adalah sama. ANOVA sehala digunakan untuk menentukan sama ada terdapat sebarang perbezaan yang signifikan secara statistik antara min tiga atau lebih kumpulan bebas (tidak berkaitan).
ANOVA dua hala ialah lanjutan daripada ANOVA sehala. Dengan satu cara, anda mempunyai satu pembolehubah bebas yang mempengaruhi pembolehubah bersandar. Dengan ANOVA dua hala, terdapat dua bebas. Sebagai contoh, ANOVA dua hala membolehkan syarikat membandingkan produktiviti pekerja berdasarkan dua pembolehubah tidak bersandar, seperti gaji dan set kemahiran. Ia digunakan untuk memerhati interaksi antara dua faktor dan menguji kesan dua faktor pada masa yang sama.
##Sorotan
Jika tiada varians benar wujud antara kumpulan, nisbah-F ANOVA hendaklah sama dengan hampir 1.
ANOVA sehala digunakan untuk tiga atau lebih kumpulan data, untuk mendapatkan maklumat tentang hubungan antara pembolehubah bersandar dan bebas.
Analisis varians, atau ANOVA, ialah kaedah statistik yang memisahkan data varians yang diperhatikan kepada komponen yang berbeza untuk digunakan untuk ujian tambahan.