Homoskedastik
Apakah Homoskedastik?
Homoskedastic (juga dieja "homoscedastic") merujuk kepada keadaan di mana varians baki, atau istilah ralat,. dalam model regresi adalah malar. Iaitu, istilah ralat tidak banyak berubah kerana nilai pembolehubah peramal berubah. Cara lain untuk mengatakan ini ialah varians titik data adalah lebih kurang sama untuk semua titik data.
Ini mencadangkan tahap ketekalan dan menjadikannya lebih mudah untuk memodelkan dan bekerja dengan data melalui regresi; bagaimanapun, kekurangan homoskedastisitas mungkin mencadangkan bahawa model regresi mungkin perlu memasukkan pembolehubah peramal tambahan untuk menerangkan prestasi pembolehubah bersandar.
Cara Homoskedastisitas Berfungsi
Homoskedastisitas ialah satu andaian pemodelan regresi hampir li dan data jenis ini berfungsi dengan baik dengan kaedah kuasa dua terkecil. Jika varians ralat di sekeliling garis regresi berbeza-beza, model regresi mungkin kurang ditakrifkan.
Lawan homoskedastisitas ialah heteroskedastisitas sama seperti lawan "homogen" ialah "heterogen." Heteroskedastisitas (juga dieja "heteroskedastisitas") merujuk kepada keadaan di mana varians istilah ralat dalam persamaan regresi tidak tetap.
Pertimbangan Khas
Model regresi mudah, atau persamaan, terdiri daripada empat sebutan. Di sebelah kiri ialah pembolehubah bersandar. Ia mewakili fenomena yang model cuba "menjelaskan." Di sebelah kanan ialah pemalar, pembolehubah peramal, dan istilah baki, atau ralat. Istilah ralat menunjukkan jumlah kebolehubahan dalam pembolehubah bersandar yang tidak dijelaskan oleh pembolehubah peramal.
Contoh Homoskedastik
Sebagai contoh, katakan anda ingin menerangkan markah ujian pelajar menggunakan jumlah masa yang diluangkan oleh setiap pelajar untuk belajar. Dalam kes ini, markah ujian akan menjadi pembolehubah bersandar dan masa yang dihabiskan untuk belajar akan menjadi pembolehubah peramal.
Istilah ralat akan menunjukkan jumlah varians dalam skor ujian yang tidak dijelaskan oleh jumlah masa belajar. Jika varians itu seragam, atau homoskedastik, maka itu akan mencadangkan model itu mungkin penjelasan yang mencukupi untuk prestasi ujian-menjelaskannya dari segi masa yang dihabiskan untuk belajar.
Tetapi varians mungkin heteroskedastik. Plot data istilah ralat mungkin menunjukkan jumlah masa belajar yang banyak sepadan dengan skor ujian yang tinggi tetapi skor ujian masa belajar yang rendah itu berbeza-beza secara meluas malah termasuk beberapa markah yang sangat tinggi.
Jadi varians skor tidak akan dijelaskan dengan baik hanya dengan satu pembolehubah peramal—jumlah masa belajar. Dalam kes ini, beberapa faktor lain mungkin sedang berfungsi, dan model itu mungkin perlu dipertingkatkan untuk mengenal pastinya atau mereka.
Apabila mempertimbangkan bahawa varians ialah perbezaan terukur antara hasil yang diramalkan dan hasil sebenar situasi tertentu, menentukan homoskedastisitas boleh membantu untuk menentukan faktor yang perlu diselaraskan untuk ketepatan.
Penyiasatan lanjut mungkin mendedahkan bahawa sesetengah pelajar telah melihat jawapan kepada ujian lebih awal atau mereka pernah mengambil ujian yang serupa, dan oleh itu tidak perlu belajar untuk ujian tertentu ini. Dalam hal ini, mungkin ternyata pelajar mempunyai tahap kebolehan lulus ujian yang berbeza tanpa mengira masa belajar mereka dan prestasi mereka pada ujian sebelumnya, tanpa mengira subjek.
Untuk menambah baik model regresi, penyelidik perlu mencuba pembolehubah penjelasan lain yang boleh memberikan kesesuaian yang lebih tepat kepada data. Jika, sebagai contoh, sesetengah pelajar telah melihat jawapan lebih awal daripada masa, model regresi kemudiannya akan mempunyai dua pembolehubah penjelasan: masa belajar, dan sama ada pelajar mempunyai pengetahuan terdahulu tentang jawapan.
Dengan kedua-dua pembolehubah ini, lebih banyak varians skor ujian akan dijelaskan dan varians istilah ralat kemudiannya mungkin homoskedastik, menunjukkan bahawa model itu ditakrifkan dengan baik.
Sorotan
Jika varians istilah ralat adalah homoskedastik, model itu ditakrifkan dengan baik. Jika terdapat terlalu banyak varians, model mungkin tidak ditakrifkan dengan baik.
Homoskedastisitas berlaku apabila varians istilah ralat dalam model regresi adalah malar.
Sebaliknya, heteroskedastisitas berlaku apabila varians istilah ralat tidak tetap.
Menambah pembolehubah peramal tambahan boleh membantu menjelaskan prestasi pembolehubah bersandar.
Soalan Lazim
Mengapakah Homoskedastisitas Penting?
Homoskedastisitas adalah penting kerana ia mengenal pasti ketidaksamaan dalam populasi. Sebarang varians dalam populasi atau sampel yang tidak sekata akan menghasilkan keputusan yang condong atau berat sebelah, menjadikan analisis tidak betul atau tidak bernilai.
Apakah Maksud Heteroskedastisitas?
Heteroskedastisitas dalam statistik ialah varians ralat. Ini ialah pergantungan penyerakan yang berlaku dalam sampel dengan sekurang-kurangnya satu pembolehubah bebas. Ini bermakna sisihan piawai bagi pembolehubah yang boleh diramal adalah tidak tetap.
Bagaimana Anda Boleh Mengetahui Jika Regresi Adalah Homoskedastik?
Anda boleh mengetahui sama ada regresi adalah homoskedastik dengan melihat nisbah antara varians terbesar dan varians terkecil. Jika nisbah adalah 1.5 atau lebih kecil, maka regresi adalah homoskedastik.