Investor's wiki

İstatistiksel anlamlılık

İstatistiksel anlamlılık

İstatistiksel Önem Nedir?

İstatistiksel önem, bir dizi gözlemlenen verinin tesadüflerin sonucu olmadığı, bunun yerine belirli bir nedene atfedilebileceği iddiasını ifade eder. İstatistiksel önem, ekonomi, finans,. yatırım,. tıp, fizik ve biyoloji gibi veri ve araştırmaların analizine büyük ölçüde dayanan akademik disiplinler veya uygulayıcılar için önemlidir .

İstatistiksel önem, güçlü veya zayıf olarak kabul edilebilir. Bir veri setini analiz ederken ve bir veya daha fazla değişkenin bir sonuç üzerinde etkisi olup olmadığını anlamak için gerekli testleri yaparken, güçlü istatistiksel anlamlılık, sonuçların gerçek olduğu ve şans veya tesadüften kaynaklanmadığı gerçeğini desteklemeye yardımcı olur. Basitçe ifade edilirse, eğer bir p değeri küçükse sonuç daha güvenilir olarak kabul edilir.

İstatistiksel anlamlılık testlerinde problemler ortaya çıkar, çünkü araştırmacılar genellikle popülasyonların kendisiyle değil, daha büyük popülasyon örnekleriyle çalışırlar. Sonuç olarak, numunelerin popülasyonu temsil etmesi gerekir, bu nedenle numunede yer alan veriler hiçbir şekilde önyargılı olmamalıdır. Ekonomi dahil çoğu bilimde, bir sonuç %95 (veya bazen %99) güven düzeyine sahipse istatistiksel olarak anlamlı kabul edilebilir.

İstatistiksel Önemi Anlamak

İstatistiksel anlamlılığın hesaplanması (önem testi) belirli bir hata derecesine tabidir. Veriler güçlü bir ilişkiye sahip gibi görünse bile, araştırmacılar rastgele şans veya bir örnekleme hatası nedeniyle belirgin bir korelasyonun ortaya çıkma olasılığını hesaba katmalıdır .

Numune boyutu, daha büyük numunelerin tesadüflere daha az eğilimli olması nedeniyle istatistiksel anlamlılığın önemli bir bileşenidir. Önem testinde yalnızca rastgele seçilmiş temsili örnekler kullanılmalıdır. Bir olayın istatistiksel olarak anlamlı olup olmadığının kabul edilebildiği düzey, anlamlılık düzeyi olarak bilinir.

istatistiksel anlamlılığı belirlemek için p değeri olarak bilinen bir ölçüm kullanır : p değeri anlamlılık seviyesinin altına düşerse, sonuç istatistiksel olarak anlamlıdır. p değeri, veri örneklerinin ortalamalarının ve standart sapmalarının bir fonksiyonudur.

p değeri, sonuçtan tek başına şansın sorumlu olduğunu varsayarak, verilen istatistiksel sonucun meydana gelme olasılığını gösterir. Bu olasılık küçükse, araştırmacı gözlemlenen verilerden başka bir faktörün sorumlu olabileceği sonucuna varabilir.

1 eksi anlamlılık düzeyi olarak hesaplanan anlamlılık düzeyinin tersi güven düzeyidir. İstatistiksel sonucun tesadüfen veya örnekleme hatasıyla oluşmadığına dair güven derecesini gösterir. Pek çok istatistiksel testte alışılmış güven seviyesi %95'tir ve bu da alışılagelmiş bir anlamlılık seviyesine veya %5'lik bir p-değerine yol açar.

"P-hacking", istatistiksel olarak anlamlı bir sonuç aramak için birçok farklı veri setini kapsamlı bir şekilde karşılaştırma uygulamasıdır. Bu, raporlama yanlılığına tabidir, çünkü araştırmacılar olumsuz değil, yalnızca olumlu sonuçlar bildirmektedir.

Özel Hususlar

İstatistiksel önem her zaman pratik önemi göstermez, yani sonuçlar gerçek dünyadaki iş durumlarına uygulanamaz. Ek olarak, araştırmacılar sonuçlarını bildirirken dili dikkatli kullanmadıklarında istatistiksel anlamlılık yanlış yorumlanabilir. Bir sonucun istatistiksel olarak anlamlı olması, tesadüfün sonucu olmadığı anlamına gelmez, sadece durumun böyle olma olasılığının daha düşük olduğu anlamına gelir.

Sadece iki veri serisinin birbiriyle güçlü bir korelasyona sahip olması nedensellik anlamına gelmez. Örneğin, belirli bir yılda aktör Nicolas Cage'in oynadığı filmlerin sayısı, yüzme havuzlarında kazara boğulmaların sayısıyla çok yüksek oranda ilişkilidir. Ancak bu bağıntı sahtedir,. çünkü yapılabilecek hiçbir teorik nedensel iddia yoktur.

İstatistiksel anlamlılıkta ortaya çıkabilecek bir diğer sorun, geçmiş verilerin ve bu verilerden elde edilen sonuçların, istatistiksel olarak anlamlı olsun veya olmasın, devam eden veya gelecekteki koşulları yansıtmayabilmesidir. Yatırımda, bu, korelasyonlar değiştikçe ve değişkenler her zamanki gibi etkileşime girmedikçe, finansal kriz zamanlarında bozulan bir fiyatlandırma modelinde kendini gösterebilir. İstatistiksel önem, bir yatırımcının bir varlık fiyatlandırma modelinin diğerinden daha iyi olup olmadığını ayırt etmesine de yardımcı olabilir.

İstatistiksel Önem Testi Türleri

Yürütülen araştırmaya bağlı olarak çeşitli anlamlılık testleri kullanılır. Örneğin testler, ortalamalar, varyanslar, orantılar, eşleştirilmiş veya eşleştirilmemiş veriler veya farklı veri dağılımları için çeşitli boyutlarda bir, iki veya daha fazla veri örneği için kullanılabilir.

Ayrıca, mevcut verilerin türüne bağlı olarak, önem testine yönelik farklı yaklaşımlar da vardır. Ronald Fisher, en esnek yaklaşımlardan birini formüle etmenin yanı sıra anlamlılık normunu p < 0.05 olarak belirlemesiyle tanınır. Çalışmaların çoğu, veriler toplandıktan sonra yapılabileceğinden, bu yöntem kısa vadeli veya geçici araştırma projeleri için popüler olmaya devam etmektedir.

Fisher'ın yöntemini geliştirmeye çalışan Jerzy Neyman ve Egon Pearson, sonunda alternatif bir yaklaşım geliştirdiler. Bu yöntem, veriler toplanmadan önce daha fazla çalışma yapılmasını gerektirir, ancak araştırmacıların çalışmalarını yanlış sonuçlara ulaşma olasılığını kontrol edecek şekilde tasarlamalarına olanak tanır.

Boş Hipotez Testi

İstatistiksel anlamlılık, araştırmacıların diğer açıklamaları reddederek teorilerini desteklemeye çalıştıkları boş hipotez testlerinde kullanılır. Yöntem bazen yanlış anlaşılsa da, tıp, psikoloji ve diğer alanlarda en popüler veri testi yöntemi olmaya devam etmektedir.

En yaygın boş hipotez, söz konusu parametrenin sıfıra eşit olmasıdır (tipik olarak bir değişkenin ilgilenilen sonuç üzerinde sıfır etkisi olduğunu belirtir). Araştırmacılar sıfır hipotezini %95 veya daha iyi bir güvenle reddederse, gözlemlenen bir ilişkinin istatistiksel olarak anlamlı olduğunu iddia edebilirler. İki veya daha fazla alternatif tedavi için etki eşitliği için boş hipotezler de test edilebilir.

Popüler yanlış anlayışın aksine, yüksek düzeyde istatistiksel anlamlılık, bir hipotezin doğru veya yanlış olduğunu kanıtlayamaz. Gerçekte, istatistiksel anlamlılık, sıfır hipotezinin doğru olduğu varsayılarak, gözlemlenen bir sonucun meydana gelme olasılığını ölçer.

Boş hipotezin reddedilmesi, çok yüksek derecede istatistiksel anlamlılık bir şeyi asla kanıtlamasa bile, yalnızca mevcut bir hipoteze destek ekleyebilir. Öte yandan, boş bir hipotezi reddetmek, çoğu zaman bir hipotezi reddetmek için bir nedendir.

Ek olarak, bir etki istatistiksel olarak anlamlı olabilir, ancak yalnızca çok küçük bir etkisi olabilir. Örneğin, banyolarında iki katlı tuvalet kağıdı kullanan şirketlerin daha üretken çalışanlara sahip olması istatistiksel olarak anlamlı olabilir, ancak her bir çalışanın mutlak verimliliğindeki iyileşmenin çok küçük olması muhtemeldir.

Düzeltme–15 Mayıs 2022: Bu makale, önem testindeki olası yanlışları vurgulamak için düzenlenmiştir.

##Öne çıkanlar

  • İstatistiksel önem, test veya deney yoluyla oluşturulan verilerden elde edilen bir sonucun belirli bir nedene atfedilebileceği iddiasını ifade eder.

  • İstatistiksel anlamlılığın hesaplanması belirli bir hata derecesine tabidir.

  • Yüksek derecede istatistiksel anlamlılık, gözlemlenen bir ilişkinin şansa bağlı olma olasılığının düşük olduğunu gösterir.

  • Yürütülen araştırmaya bağlı olarak çeşitli anlamlılık testleri kullanılır.

  • Araştırmacılar sonuçlarını bildirirken dili dikkatli kullanmadıklarında istatistiksel önem yanlış yorumlanabilir.