Investor's wiki

Statistik Bukan Parametrik

Statistik Bukan Parametrik

Apakah Statistik Bukan Parametrik?

Statistik bukan parametrik merujuk kepada kaedah statistik di mana data tidak diandaikan datang daripada model yang ditetapkan yang ditentukan oleh sebilangan kecil parameter; contoh model tersebut termasuk model taburan normal dan model regresi linear. Statistik bukan parametrik kadangkala menggunakan data yang berbentuk ordinal, bermakna ia tidak bergantung pada nombor, sebaliknya pada kedudukan atau susunan jenis. Sebagai contoh, tinjauan yang menyampaikan pilihan pengguna daripada suka hingga tidak suka akan dianggap sebagai data ordinal.

Statistik bukan parametrik termasuk statistik deskriptif bukan parametrik,. model statistik, inferens dan ujian statistik. Struktur model model bukan parametrik tidak dinyatakan a priori tetapi sebaliknya ditentukan daripada data. Istilah nonparametrik tidak bermaksud untuk membayangkan bahawa model sedemikian benar-benar kekurangan parameter, sebaliknya bilangan dan sifat parameter adalah fleksibel dan tidak ditetapkan terlebih dahulu. Histogram ialah contoh anggaran bukan parametrik bagi taburan kebarangkalian.

Memahami Statistik Bukan Parametrik

Dalam statistik, statistik parametrik termasuk parameter seperti min, sisihan piawai, korelasi Pearson, varians, dsb. Bentuk statistik ini menggunakan data yang diperhatikan untuk menganggar parameter taburan. Di bawah statistik parametrik, data sering diandaikan datang daripada taburan normal dengan parameter tidak diketahui μ (min populasi) dan σ2 (varians populasi), yang kemudiannya dianggarkan menggunakan min sampel dan varians sampel.

Statistik bukan parametrik tidak membuat andaian tentang saiz sampel atau sama ada data yang diperhatikan adalah kuantitatif.

Statistik bukan parametrik tidak menganggap bahawa data diambil daripada taburan normal. Sebaliknya, bentuk taburan dianggarkan di bawah bentuk ukuran statistik ini. Walaupun terdapat banyak situasi di mana taburan normal boleh diandaikan, terdapat juga beberapa senario di mana proses penjanaan data sebenar adalah jauh daripada taburan normal.

Contoh Perangkaan Bukan Parametrik

Dalam contoh pertama, pertimbangkan penganalisis kewangan yang ingin menganggarkan nilai berisiko (VaR) sesuatu pelaburan. Penganalisis mengumpulkan data pendapatan daripada 100 pelaburan serupa dalam tempoh masa yang sama. Daripada menganggap bahawa pendapatan mengikut taburan normal, mereka menggunakan histogram untuk menganggarkan taburan secara bukan parametrik. Persentil ke-5 histogram ini kemudian memberikan penganalisis dengan anggaran bukan parametrik VaR.

Untuk contoh kedua, pertimbangkan penyelidik lain yang ingin mengetahui sama ada purata jam tidur dikaitkan dengan kekerapan seseorang jatuh sakit. Oleh kerana ramai orang jarang jatuh sakit, jika ada, dan kadang-kadang orang lain jatuh sakit jauh lebih kerap daripada kebanyakan orang lain, taburan kekerapan penyakit adalah jelas tidak normal, condong ke kanan dan lebih terdedah. Oleh itu, daripada menggunakan kaedah yang menganggap taburan normal untuk kekerapan penyakit, seperti yang dilakukan dalam analisis regresi klasik, sebagai contoh, penyelidik memutuskan untuk menggunakan kaedah bukan parametrik seperti analisis regresi kuantil.

Pertimbangan Khas

Statistik bukan parametrik telah mendapat penghargaan kerana kemudahan penggunaannya. Memandangkan keperluan untuk parameter dilegakan, data menjadi lebih sesuai untuk pelbagai ujian yang lebih besar. Perangkaan jenis ini boleh digunakan tanpa min, saiz sampel, sisihan piawai atau anggaran mana-mana parameter lain yang berkaitan apabila tiada maklumat itu tersedia.

Memandangkan statistik bukan parametrik membuat lebih sedikit andaian tentang data sampel, penggunaannya lebih luas dalam skop berbanding statistik parametrik. Dalam kes di mana ujian parametrik lebih sesuai, kaedah bukan parametrik akan menjadi kurang cekap. Ini kerana statistik bukan parametrik membuang beberapa maklumat yang tersedia dalam data, tidak seperti statistik parametrik.

##Sorotan

  • Jenis analisis ini selalunya paling sesuai apabila mempertimbangkan susunan sesuatu, di mana walaupun data berangka berubah, keputusan mungkin akan kekal sama.

  • Statistik bukan parametrik mudah digunakan tetapi tidak menawarkan ketepatan tepat model statistik lain.