後退帰納法

##後退帰納法とは何ですか？

ゲーム理論における後退帰納法は、問題や状況の終わりから、有限の展開型ゲームと逐次ゲームを解決し、一連の最適なアクションを推測するために、時間を遡って推論する反復プロセスです。

##後退帰納法の説明

ジョン・フォン・ノイマンとオスカー・モルゲンシュテルンが1944年に著書「ゲームの理論と経済行動」を出版したときにゲーム理論を学問として確立して以来、後退帰納法はゲームの解決に使用されてきました。

ゲームの各段階で、後退帰納法は、ゲームの最後の動きをするプレーヤーの最適な戦略を決定します。次に、最後から2番目に移動するプレーヤーの最適なアクションが決定され、最後のプレーヤーのアクションが与えられたとおりになります。このプロセスは、すべての時点で最適なアクションが決定されるまで逆方向に続きます。事実上、元のゲームの各サブゲームのナッシュ均衡を決定することです。

ただし、後退帰納法から推測される結果は、実際の人間の遊びを予測できないことがよくあります。実験的研究は、（ゲーム理論によって予測された）「合理的な」行動が実際の生活ではめったに示されないことを示しています。ムカデゲームに示されているように、不合理なプレーヤーは、実際には後退帰納法によって予測されるよりも高いペイオフを得ることになります。

ムカデゲームでは、2人のプレーヤーが交互に、増加するポットのより大きなシェアを獲得するか、ポットを他のプレーヤーに渡す機会を得ます。ペイオフは、ポットが対戦相手に渡され、対戦相手が次のラウンドでポットを獲得した場合、このラウンドでポットを獲得した場合よりもわずかに少なくなるように配置されます。ゲームは、プレーヤーが隠し場所を取得するとすぐに終了し、そのプレーヤーがより大きな部分を取得し、他のプレーヤーがより小さな部分を取得します。

##後退帰納法の例

例として、Izazが最初に行き、現在2ドルに相当する隠し場所を「取る」か「渡す」かを決定する必要があると仮定します。彼らが取る場合、IzazとJianはそれぞれ1ドルを受け取りますが、Izazが合格した場合、今取るか合格するかの決定はJianによって行われる必要があります。 Jianが取る場合、彼らは$ 3（つまり、前の$ 2 + $ 1の隠し場所）を取得し、Izazは$0を取得します。しかし、Jianが合格した場合、Izazは、合格するか合格するかなどを決定できるようになります。両方のプレーヤーが常にパスすることを選択した場合、ゲームの終了時にそれぞれ100ドルのペイオフを受け取ります。

ゲームのポイントは、IzazとJianの両方が協力し、ゲームが終了するまでパスを続ける場合、それぞれ最大$100の支払いを受け取ることです。しかし、彼らが他のプレーヤーを信用せず、最初の機会に「取る」ことを期待する場合、ナッシュ均衡は、プレーヤーが可能な限り低い請求（この場合は$ 1）を取ると予測します。

このゲームのナッシュ均衡では、対戦相手の選択を考慮した後、選択した戦略から逸脱するインセンティブを持っているプレーヤーはいないため、最初のプレーヤーがゲームの最初のラウンドでポットを獲得することを示唆しています。ただし、実際には、そうするプレーヤーは比較的少数です。その結果、平衡分析によって予測されたペイオフよりも高いペイオフが得られます。

##後退帰納法を使用した逐次手番ゲームの解決

以下は、2人のプレーヤー間の単純な逐次手番ゲームです。プレーヤー1とプレーヤー2が含まれるラベルは、それぞれプレーヤー1または2の情報セットです。ツリーの下部にある括弧内の数字は、それぞれのポイントでの見返りです。ゲームもシーケンシャルであるため、プレーヤー1が最初の決定（左または右）を行い、プレーヤー2がプレーヤー1の後に決定（上または下）します。

<！-360C571136D68BDF7B1BE984014B1A1C->

後退帰納法は、すべてのゲーム理論と同様に、合理性と最大化の仮定を使用します。つまり、プレーヤー2は、特定の状況で利益を最大化します。どちらの情報セットでも、2つの選択肢があり、全部で4つあります。プレーヤー2が選択しない選択肢を排除することで、ツリーを絞り込むことができます。このようにして、与えられた情報セットでプレーヤーの見返りを最大化する線を青でマークします。

<！-E78C02A07C982A1B447ED0D16A9FCE40->

この削減の後、プレーヤー1は、プレーヤー2の選択が知られるようになったため、その見返りを最大化できます。結果は、プレーヤー1が「右」を選択し、プレーヤー2が「上」を選択するという後退帰納法によって見出される均衡です。以下は、平衡パスを太字にしたゲームの解決策です。

<！-4DEC4364358F0D1CB7D219006F74D652-->

たとえば、会社をプレーヤーとして使用して、上記のようなゲームを簡単にセットアップできます。このゲームには、製品リリースシナリオが含まれる可能性があります。会社1が製品をリリースしたい場合、会社2はそれに応じて何をしますか？ Company 2は同様の競合製品をリリースしますか？さまざまなシナリオでこの新製品の売上を予測することで、イベントがどのように展開するかを予測するゲームを設定できます。以下は、そのようなゲームをモデル化する方法の例です。

<！-D102F649421403ABDBD56A5C1B29CF03->