Investor's wiki

Aşırı uyum gösterme

Aşırı uyum gösterme

Fazla Takma Nedir?

Fazla uydurma, bir fonksiyon sınırlı bir dizi veri noktasına çok yakın hizalandığında ortaya çıkan istatistiklerde bir modelleme hatasıdır. Sonuç olarak, model, diğer veri kümelerine değil, yalnızca ilk veri kümesine referans olarak yararlıdır.

Modelin gereğinden fazla uydurulması, genellikle, incelenen verilerdeki özel durumları açıklamak için aşırı karmaşık bir model yapma biçimini alır. Gerçekte, sıklıkla çalışılan veriler içinde bir dereceye kadar hata veya rastgele gürültü içerir. Bu nedenle, modeli biraz hatalı verilere çok yakın hale getirmeye çalışmak, modele önemli hatalar bulaştırabilir ve tahmin gücünü azaltabilir.

Fazla Takmayı Anlamak

Örneğin, yaygın bir sorun, kalıpları bulmak için geçmiş piyasa verilerinin kapsamlı veritabanlarını aramak için bilgisayar algoritmalarını kullanmaktır. Yeterli çalışma verildiğinde, borsadaki getirileri yakın doğrulukla tahmin ediyor gibi görünen ayrıntılı teoremler geliştirmek çoğu zaman mümkündür.

Bununla birlikte, numunenin dışındaki verilere uygulandığında, bu tür teoremler, bir modelin gerçekte sadece tesadüfi olaylara fazla uydurma olduğunu kanıtlayabilir. Her durumda, bir modeli, onu geliştirmek için kullanılan örneğin dışındaki verilere karşı test etmek önemlidir.

Fazla Takma Nasıl Önlenir

Fazla uyumu önlemenin yolları arasında, modeli eğitmek için kullanılan verilerin katlara veya bölümlere ayrıldığı ve modelin her kat için çalıştırıldığı çapraz doğrulama yer alır. Ardından, genel hata tahmininin ortalaması alınır. Diğer yöntemler, birleştirmeyi içerir: tahminler, en az iki ayrı modelden birleştirilir, mevcut veri setinin çeşitli görünmesi için yapılan veri büyütme ve modelin fazla uydurmayı önlemek için düzenlendiği veri basitleştirme.

Finans uzmanları, sınırlı verilere dayalı bir modele fazla ya da eksik uymanın tehlikelerinin her zaman farkında olmalıdır. İdeal model dengeli olmalıdır.

Makine Öğreniminde Fazla Uyum

Aşırı takma, makine öğreniminde de bir faktördür. Bir makineye belirli verileri tek bir şekilde taraması öğretildiğinde ortaya çıkabilir, ancak aynı işlem yeni bir veri kümesine uygulandığında sonuçlar yanlıştır. Bunun nedeni, muhtemelen düşük sapma ve yüksek varyans göstermesi nedeniyle oluşturulan modeldeki hatalardır. Model, gereksiz yere karmaşık hale gelmesine ve dolayısıyla etkisiz hale gelmesine neden olacak şekilde gereksiz veya örtüşen özelliklere sahip olabilir.

Aşırı takma vs. yetersiz

Fazla takılan bir model çok karmaşık olabilir ve bu da onu etkisiz hale getirir. Ancak bir model de yetersiz donatılabilir, yani çok az özellik ve etkili bir model oluşturmak için çok az veri ile çok basit. Bir üst model modelde düşük sapma ve yüksek varyans bulunurken, iç giyim modeli tam tersidir; yüksek sapma ve düşük varyansa sahiptir. Çok basit bir modele daha fazla özellik eklemek, yanlılığı sınırlamaya yardımcı olabilir.

Fazla Takma Örneği

Örneğin, üniversiteyi terk etme oranının olmasını istediğinden daha yüksek olan bir üniversite, başvuranın mezuniyete kadar devam etme olasılığını tahmin etmek için bir model oluşturmak istediğine karar verir.

Bunu yapmak için üniversite, 5.000 başvurudan ve bunların sonuçlarından oluşan bir veri kümesinden bir model eğitir. Ardından, modeli orijinal veri kümesinde (5.000 başvurandan oluşan grup) çalıştırır ve model sonucu %98 doğrulukla tahmin eder. Ancak, doğruluğunu test etmek için, modeli ikinci bir veri kümesinde de çalıştırıyorlar: 5.000 başvuru sahibi daha. Ancak bu sefer, model dar bir veri alt kümesine, bu durumda ilk 5.000 uygulamaya çok yakın olduğundan, model yalnızca %50 doğrudur.

##Öne çıkanlar

  • Fazla uydurma, belirli bir işlevin minimum veri noktaları kümesine çok yakın hizalanmasının bir sonucu olarak veri modellemede meydana gelen bir hatadır.

  • Bir model, fazla uydurma nedeniyle tehlikeye girdiğinde, model, yatırım için bir tahmin aracı olarak değerini kaybedebilir.

  • Bir veri modeli yetersiz donatılabilir, yani çok basit ve etkili olamayacak kadar az veri noktası vardır.

  • Finans uzmanları, sınırlı verilere dayalı bir modele gereğinden fazla uyma ve hatalı sonuçlarla sonuçlanma riski altındadır.

  • Fazla takma, eksik takmadan daha sık görülen bir sorundur ve genellikle fazla takmayı önlemeye çalışmanın bir sonucu olarak ortaya çıkar.