Kepentingan Statistik

Apakah Kepentingan Statistik?

Kepentingan statistik merujuk kepada dakwaan bahawa satu set data yang diperhatikan bukanlah hasil kebetulan tetapi sebaliknya boleh dikaitkan dengan sebab tertentu. Kepentingan statistik adalah penting untuk disiplin akademik atau pengamal yang sangat bergantung pada analisis data dan penyelidikan, seperti ekonomi, kewangan,. pelaburan,. perubatan, fizik dan biologi.

Kepentingan statistik boleh dianggap kuat atau lemah. Apabila menganalisis set data dan melakukan ujian yang diperlukan untuk membezakan sama ada satu atau lebih pembolehubah mempunyai kesan ke atas hasil, kepentingan statistik yang kuat membantu menyokong fakta bahawa keputusan adalah nyata dan bukan disebabkan oleh nasib atau kebetulan. Secara ringkasnya, jika nilai p adalah kecil maka hasilnya dianggap lebih dipercayai.

Masalah timbul dalam ujian kepentingan statistik kerana penyelidik biasanya bekerja dengan sampel populasi yang lebih besar dan bukan populasi itu sendiri. Akibatnya, sampel mestilah mewakili populasi, jadi data yang terkandung dalam sampel tidak boleh berat sebelah dalam apa cara sekalipun. Dalam kebanyakan sains, termasuk ekonomi, keputusan boleh dianggap signifikan secara statistik jika ia mempunyai tahap keyakinan 95% (atau kadangkala 99%).

Memahami Kepentingan Statistik

Pengiraan keertian statistik (ujian keertian) tertakluk kepada tahap ralat tertentu. Walaupun data kelihatan mempunyai hubungan yang kukuh, penyelidik mesti mengambil kira kemungkinan bahawa korelasi yang jelas timbul disebabkan peluang rawak atau ralat pensampelan.

Saiz sampel ialah komponen penting dalam kepentingan statistik kerana sampel yang lebih besar kurang terdedah kepada kebetulan. Hanya sampel wakil yang dipilih secara rawak harus digunakan dalam ujian kepentingan. Tahap di mana seseorang boleh menerima sama ada sesuatu peristiwa adalah signifikan secara statistik dikenali sebagai tahap keertian.

Penyelidik menggunakan ukuran yang dikenali sebagai nilai -p untuk menentukan kepentingan statistik: jika nilai-p jatuh di bawah paras keertian, maka hasilnya adalah signifikan secara statistik. Nilai-p ialah fungsi min dan sisihan piawai sampel data.

Nilai-p menunjukkan kebarangkalian di mana keputusan statistik yang diberikan berlaku, dengan mengandaikan peluang sahaja bertanggungjawab untuk hasilnya. Sekiranya kebarangkalian ini kecil, maka penyelidik boleh membuat kesimpulan bahawa beberapa faktor lain boleh bertanggungjawab untuk data yang diperhatikan.

Lawan daripada aras keertian, yang dikira sebagai 1 tolak aras keertian, ialah aras keyakinan. Ia menunjukkan tahap keyakinan bahawa keputusan statistik tidak berlaku secara kebetulan atau oleh ralat pensampelan. Tahap keyakinan lazim dalam banyak ujian statistik ialah 95%, membawa kepada tahap keertian lazim atau nilai p sebanyak 5%.

"P-penggodaman" ialah amalan membandingkan secara menyeluruh banyak set data yang berbeza untuk mencari hasil yang signifikan secara statistik. Ini tertakluk kepada pelaporan berat sebelah kerana penyelidik hanya melaporkan keputusan yang menggalakkan–bukan keputusan negatif.

Pertimbangan Khas

Kepentingan statistik tidak selalu menunjukkan kepentingan praktikal, bermakna keputusan tidak boleh digunakan pada situasi perniagaan dunia sebenar. Selain itu, kepentingan statistik boleh disalahtafsirkan apabila penyelidik tidak menggunakan bahasa dengan teliti dalam melaporkan keputusan mereka. Hakikat bahawa keputusan adalah signifikan dari segi statistik tidak membayangkan bahawa ia bukan hasil kebetulan, cuma ini berkemungkinan kecil berlaku.

Hanya kerana dua siri data mempunyai korelasi yang kuat antara satu sama lain tidak menunjukkan sebab. Sebagai contoh, bilangan filem yang dibintangi oleh pelakon Nicolas Cage pada tahun tertentu sangat berkait rapat dengan bilangan lemas secara tidak sengaja di kolam renang. Tetapi korelasi ini adalah palsu kerana tidak ada dakwaan penyebab teori yang boleh dibuat.

Satu lagi masalah yang mungkin timbul dengan kepentingan statistik ialah data masa lalu, dan keputusan daripada data itu, sama ada signifikan secara statistik atau tidak, mungkin tidak menggambarkan keadaan berterusan atau masa hadapan. Dalam pelaburan, ini mungkin nyata dalam model harga yang rosak semasa krisis kewangan kerana korelasi berubah dan pembolehubah tidak berinteraksi seperti biasa. Kepentingan statistik juga boleh membantu pelabur membezakan sama ada satu model penentuan harga aset lebih baik daripada yang lain.

Jenis Ujian Kepentingan Statistik

Beberapa jenis ujian keertian digunakan bergantung kepada penyelidikan yang dijalankan. Sebagai contoh, ujian boleh digunakan untuk satu, dua atau lebih sampel data pelbagai saiz untuk purata, varians, perkadaran, data berpasangan atau tidak berpasangan, atau pengagihan data yang berbeza.

Terdapat juga pendekatan yang berbeza untuk ujian kepentingan, bergantung pada jenis data yang tersedia. Ronald Fisher dikreditkan dengan merumuskan salah satu pendekatan yang paling fleksibel, serta menetapkan norma untuk kepentingan pada p < 0.05. Oleh kerana kebanyakan kerja boleh dilakukan selepas data telah dikumpulkan, kaedah ini kekal popular untuk projek penyelidikan jangka pendek atau ad-hoc.

Berusaha untuk membina kaedah Fisher, Jerzy Neyman dan Egon Pearson akhirnya membangunkan pendekatan alternatif. Kaedah ini memerlukan lebih banyak kerja yang perlu dilakukan sebelum data dikumpul, tetapi ia membolehkan penyelidik mereka bentuk kajian mereka dengan cara yang mengawal kebarangkalian mencapai kesimpulan yang salah.

Ujian Hipotesis Nul

Kepentingan statistik digunakan dalam ujian hipotesis nol di mana penyelidik cuba menyokong teori mereka dengan menolak penjelasan lain. Walaupun kaedah itu kadangkala disalahfahamkan, ia kekal sebagai kaedah ujian data yang paling popular dalam bidang perubatan, psikologi dan bidang lain.

Hipotesis nol yang paling biasa ialah parameter yang dipersoalkan adalah sama dengan sifar (biasanya menunjukkan bahawa pembolehubah mempunyai kesan sifar pada hasil yang diminati). Jika penyelidik menolak hipotesis nol dengan keyakinan 95% atau lebih baik, mereka boleh mendakwa bahawa hubungan yang diperhatikan adalah signifikan secara statistik. Hipotesis nol juga boleh diuji untuk kesamaan kesan untuk dua atau lebih rawatan alternatif.

Bertentangan dengan tanggapan salah popular, tahap kepentingan statistik yang tinggi tidak dapat membuktikan bahawa hipotesis adalah benar atau palsu. Pada hakikatnya, kepentingan statistik mengukur kemungkinan hasil yang diperhatikan akan berlaku, dengan mengandaikan bahawa hipotesis nol adalah benar.

Penolakan hipotesis nol, walaupun tahap kepentingan statistik yang sangat tinggi tidak sekali-kali dapat membuktikan sesuatu, hanya boleh menambah sokongan kepada hipotesis sedia ada. Sebaliknya, kegagalan untuk menolak hipotesis nol selalunya menjadi alasan untuk menolak hipotesis.

Selain itu, kesan boleh menjadi ketara secara statistik tetapi hanya mempunyai kesan yang sangat kecil. Sebagai contoh, mungkin signifikan secara statistik bahawa syarikat yang menggunakan kertas tandas dua lapis di bilik mandi mereka mempunyai pekerja yang lebih produktif, tetapi peningkatan dalam produktiviti mutlak setiap pekerja berkemungkinan kecil.

Pembetulan–15 Mei 2022: Artikel ini telah disunting untuk menyerlahkan kemungkinan kesilapan dalam ujian kepentingan.

##Sorotan

Kepentingan statistik merujuk kepada dakwaan bahawa hasil daripada data yang dijana melalui ujian atau percubaan berkemungkinan dikaitkan dengan sebab tertentu.
Pengiraan kepentingan statistik tertakluk kepada tahap ralat tertentu.
Tahap kepentingan statistik yang tinggi menunjukkan bahawa hubungan yang diperhatikan tidak mungkin disebabkan oleh kebetulan.
Beberapa jenis ujian keertian digunakan bergantung kepada penyelidikan yang dijalankan.
Kepentingan statistik boleh disalahtafsirkan apabila penyelidik tidak menggunakan bahasa dengan teliti dalam melaporkan keputusan mereka.