Geriye dönük

Geriye Yönelik Tümevarım Nedir?

Oyun teorisinde geriye dönük tümevarım , bir problemin veya durumun sonundan, sonlu bir kapsamlı formu ve ardışık oyunları çözmek ve bir dizi optimal eylem sonucunu çıkarmak için zamanda geriye doğru akıl yürütmenin yinelemeli bir sürecidir.

Geriye Doğru Tümevarım Açıklaması

Geriye dönük tümevarım, John von Neumann ve Oskar Morgenstern 1944'te Oyunlar Teorisi ve Ekonomik Davranış adlı kitaplarını yayınladıklarında oyun teorisini akademik bir konu olarak kurduklarından beri oyunları çözmek için kullanılmıştır.

Oyunun her aşamasında geriye dönük çıkarım, oyundaki son hamleyi yapan oyuncunun optimal stratejisini belirler. Ardından, son oyuncunun eylemi verildiği gibi alınarak, sondan sondan hareket eden oyuncunun optimal eylemi belirlenir. Bu süreç, zaman içindeki her nokta için en iyi eylem belirlenene kadar geriye doğru devam eder. Etkili olarak, orijinal oyunun her bir alt oyununun Nash dengesi belirlenir.

Bununla birlikte, geriye dönük çıkarımdan çıkarılan sonuçlar, çoğu zaman gerçek insan oyununu öngörmekte başarısız olur. Deneysel çalışmalar, "rasyonel" davranışın (oyun teorisinin öngördüğü gibi) gerçek hayatta nadiren sergilendiğini göstermiştir. Mantıksız oyuncular aslında kırkayak oyununda gösterildiği gibi geriye dönük çıkarımla tahmin edilenden daha yüksek getiriler elde edebilirler .

Kırkayak oyununda, iki oyuncu dönüşümlü olarak artan bir pot paradan daha büyük bir pay alma veya potu diğer oyuncuya geçirme şansı elde eder. Kazançlar, pot rakibine geçerse ve rakip potu bir sonraki turda alırsa, bu turda potu almış olandan biraz daha az alacak şekilde düzenlenir. Oyun, bir oyuncu zulayı alır almaz sona erer, bu oyuncu daha büyük kısmı alır ve diğer oyuncu daha küçük kısmı alır.

Geriye Yönelik Tümevarım Örneği

Örnek olarak, Izaz'ın önce gittiğini ve şu anda 2 ABD doları tutarındaki zulayı “almaları” veya “geçmeleri” gerektiğine karar vermesi gerektiğini varsayalım. Alırlarsa, Izaz ve Jian'ın her biri 1 dolar alır, ancak Izaz geçerse, şimdi alma veya geçme kararı Jian tarafından verilmelidir. Jian alırsa, 3 $ (yani, önceki 2 $ + 1 $ zulası) ve Izaz 0 $ alır. Ama eğer Jian geçerse, Izaz şimdi almak mı yoksa geçmek mi gerektiğine karar verecek ve bu böyle devam edecek. Her iki oyuncu da her zaman geçmeyi seçerse, oyunun sonunda her biri 100$'lık bir ödül alır.

Oyunun amacı, eğer Izaz ve Jian işbirliği yapar ve oyunun sonuna kadar pas geçmeye devam ederse, her biri 100$'lık maksimum ödeme alırlar. Ancak diğer oyuncuya güvenmezlerse ve ilk fırsatta “almalarını” beklerlerse, Nash dengesi oyuncuların mümkün olan en düşük talebi (bu durumda 1$) alacağını tahmin eder.

Hiçbir oyuncunun rakibinin seçimini düşündükten sonra seçtikleri stratejiden sapmaya teşvik etmediği bu oyunun Nash dengesi, ilk oyuncunun potu oyunun ilk turunda alacağını gösterir. Bununla birlikte, gerçekte, nispeten az sayıda oyuncu bunu yapar. Sonuç olarak, denge analizi tarafından tahmin edilen getiriden daha yüksek bir getiri elde ederler.

Geriye Yönelik Tümevarım Kullanarak Sıralı Oyunları Çözme

Aşağıda iki oyuncu arasında basit bir sıralı oyun bulunmaktadır. İçinde Oyuncu 1 ve Oyuncu 2 bulunan etiketler, sırasıyla bir veya iki oyuncu için bilgi kümeleridir. Ağacın altındaki parantez içindeki sayılar, her bir ilgili noktadaki getirilerdir. Oyun aynı zamanda sıralıdır, bu nedenle ilk kararı Oyuncu 1 verir (sol veya sağ) ve Oyuncu 2 kararını Oyuncu 1'den sonra (yukarı veya aşağı) verir.

Geriye dönük tümevarım, tüm oyun teorileri gibi, rasyonellik ve maksimizasyon varsayımlarını kullanır, yani Oyuncu 2'nin herhangi bir durumda getirisini maksimize edeceği anlamına gelir. Her iki bilgi setinde de iki seçeneğimiz var, toplamda dört. Oyuncu 2'nin seçmeyeceği seçenekleri eleyerek ağacımızı daraltabiliriz. Bu şekilde, verilen bilgi setinde oyuncunun getirisini maksimize eden çizgileri mavi ile işaretleyeceğiz.

Bu azalmadan sonra Oyuncu 1, Oyuncu 2'nin seçimleri bilindiği için getirilerini maksimize edebilir. Sonuç, Oyuncu 1'in "sağ"ı ve Oyuncu 2'nin "yukarı"yı seçmesinin geriye dönük çıkarımıyla bulunan bir dengedir. Aşağıda, denge yolu kalın harflerle yazılmış oyunun çözümü verilmiştir.

Örneğin, oyuncu olarak şirketleri kullanarak yukarıdakine benzer bir oyun kolayca kurulabilir. Bu oyun, ürün sürüm senaryolarını içerebilir . Şirket 1 bir ürünü piyasaya sürmek isterse, Şirket 2 buna karşılık ne yapabilir? Şirket 2, benzer bir rakip ürünü piyasaya sürecek mi? Bu yeni ürünün satışlarını farklı senaryolarda tahmin ederek, olayların nasıl gelişebileceğini tahmin etmek için bir oyun kurabiliriz. Aşağıda böyle bir oyunun nasıl modellenebileceğine dair bir örnek verilmiştir.