الحث الوراء

ما هو الاستقراء العكسي؟

الاستدلال العكسي في نظرية اللعبة هو عملية تكرارية للتفكير المتخلف في الزمن ، من نهاية مشكلة أو موقف ، لحل الشكل المنتهي المكثف والألعاب المتسلسلة ، واستنتاج سلسلة من الإجراءات المثلى.

شرح الحث الخلفي

تم استخدام الاستقراء العكسي لحل الألعاب منذ أن أسس جون فون نيومان وأوسكار مورجينسترن نظرية الألعاب كموضوع أكاديمي عندما نشرا كتابهما ، ** نظرية الألعاب والسلوك الاقتصادي ** في عام 1944.

في كل مرحلة من مراحل اللعبة ، يحدد الاستقراء للخلف الاستراتيجية المثلى للاعب الذي يقوم بالخطوة الأخيرة في اللعبة. بعد ذلك ، يتم تحديد الإجراء الأمثل للاعب المتحرك من التالي إلى الأخير ، مع اتخاذ الإجراء الأخير للاعب كما هو محدد. تستمر هذه العملية إلى الوراء حتى يتم تحديد الإجراء الأفضل لكل نقطة في الوقت المناسب. على نحو فعال ، يقوم المرء بتحديد توازن ناش لكل لعبة فرعية من اللعبة الأصلية.

ومع ذلك ، فإن النتائج المستخلصة من الحث المتخلف غالبًا ما تفشل في التنبؤ بلعب الإنسان الفعلي. أظهرت الدراسات التجريبية أن السلوك "العقلاني" (كما تنبأت نظرية اللعبة) نادرًا ما يظهر في الحياة الواقعية. قد ينتهي الأمر باللاعبين غير العقلانيين إلى الحصول على مكافآت أعلى مما توقعه الاستقراء العكسي ، كما هو موضح في لعبة حريش.

في لعبة حريش ، يحصل لاعبان بالتناوب على فرصة لأخذ حصة أكبر من رهان متزايد من المال ، أو لتمرير الرهان إلى اللاعب الآخر. يتم ترتيب المكافآت بحيث إذا تم تمرير القدر إلى الخصم وحصل الخصم على الرهان في الجولة التالية ، يحصل المرء على أقل قليلاً مما لو كان قد أخذ الرهان في هذه الجولة. تنتهي اللعبة بمجرد أن يأخذ اللاعب المخبأ ، حيث يحصل ذلك اللاعب على الجزء الأكبر ويحصل اللاعب الآخر على الجزء الأصغر.

مثال على الاستقراء العكسي

على سبيل المثال ، افترض أن إيزاز يذهب أولاً وعليه أن يقرر ما إذا كان يجب "أخذ" أو "تمرير" المخبأ ، والذي يبلغ حاليًا 2 دولار. إذا أخذوا ، فسيحصل كل من إيزاز وجيان على دولار واحد ، ولكن إذا تم تمرير إيزاز ، فإن قرار اتخاذ القرار أو تمريره الآن يجب أن يتخذه جيان. إذا أخذ Jian ، فسيحصلون على 3 دولارات (أي ، المبلغ السابق 2 دولار + 1 دولار) وسيحصل إيزاز على 0 دولار. لكن إذا نجح جيان ، فإن إيزاز يقرر الآن ما إذا كان سيأخذ أو يمر ، وهكذا دواليك. إذا اختار كلا اللاعبين التمرير دائمًا ، فسيحصل كل منهما على مكافأة قدرها 100 دولار في نهاية اللعبة.

الهدف من اللعبة هو أنه إذا تعاون كل من Izaz و Jian واستمرا في المرور حتى نهاية اللعبة ، فإنهما يحصلان على أقصى تعويض قدره 100 دولار لكل منهما. ولكن إذا كانوا لا يثقون في اللاعب الآخر ويتوقعون منهم أن "ينتهزوا" في أول فرصة ، فإن توازن ناش يتوقع أن يحصل اللاعبون على أقل مطالبة ممكنة (دولار واحد في هذه الحالة).

يشير توازن ناش في هذه اللعبة ، حيث لا يوجد لدى أي لاعب حافز للانحراف عن الإستراتيجية التي اختارها بعد التفكير في اختيار الخصم ، إلى أن اللاعب الأول سيأخذ الرهان في الجولة الأولى من اللعبة. ومع ذلك ، في الواقع ، عدد قليل نسبيًا من اللاعبين يفعلون ذلك. نتيجة لذلك ، يحصلون على عائد أعلى من العائد الذي توقعه تحليل التوازن.

حل الألعاب المتسلسلة باستخدام الاستقراء الخلفي

يوجد أدناه لعبة تسلسلية بسيطة بين لاعبين. الملصقات التي تحتوي على Player 1 و Player 2 بداخلها هي مجموعات المعلومات للاعبين واحد أو اثنين ، على التوالي. الأرقام الموجودة بين الأقواس في أسفل الشجرة هي المكافآت في كل نقطة على حدة. اللعبة متسلسلة أيضًا ، لذلك يتخذ اللاعب 1 القرار الأول (يسارًا أو يمينًا) ويتخذ اللاعب 2 قراره بعد اللاعب 1 (لأعلى أو لأسفل).

<! - 360C571136D68BDF7B1BE984014B1A1C ->

يستخدم الاستقراء العكسي ، مثله مثل جميع نظريات اللعبة ، افتراضات العقلانية والتعظيم ، مما يعني أن اللاعب 2 سيزيد مردوده في أي موقف معين. في أي من مجموعتي المعلومات لدينا خياران ، أربعة في المجموع. بإلغاء الخيارات التي لن يختارها اللاعب 2 ، يمكننا تضييق نطاق شجرتنا. بهذه الطريقة ، سنضع علامة على الخطوط باللون الأزرق التي تزيد أرباح اللاعب إلى أقصى حد في مجموعة المعلومات المحددة.

<! - E78C02A07C982A1B447ED0D16A9FCE40->

بعد هذا التخفيض ، يمكن للاعب 1 زيادة أرباحه إلى أقصى حد الآن بعد أن أصبحت خيارات اللاعب 2 معروفة. والنتيجة هي توازن تم العثور عليه عن طريق الحث العكسي للاعب 1 باختيار "الصحيح" والاعب 2 باختيار "أعلى". يوجد أدناه حل اللعبة مع مسار التوازن بخط عريض.

<! - 4DEC4364358F0D1CB7D219006F74D652 ->

على سبيل المثال ، يمكن للمرء بسهولة إعداد لعبة مشابهة لتلك المذكورة أعلاه باستخدام الشركات كلاعبين. يمكن أن تتضمن هذه اللعبة سيناريوهات إصدار المنتج . إذا أرادت الشركة 1 إطلاق منتج ، فما الذي يمكن أن تفعله الشركة 2 ردًا على ذلك؟ هل ستصدر الشركة 2 منتجًا منافسًا مشابهًا؟ من خلال التنبؤ بمبيعات هذا المنتج الجديد في سيناريوهات مختلفة ، يمكننا إعداد لعبة للتنبؤ بكيفية تطور الأحداث. فيما يلي مثال على كيفية تصميم مثل هذه اللعبة.

<! - D102F649421403ABDBD56A5C1B29CF03 ->