Investor's wiki

反向感应

反向感应

什么是反向感应?

博弈论中的反向归纳是一个迭代过程,从问题或情况的结尾开始,在时间上进行反向推理,以解决有限的扩展形式和顺序博弈,并推断出一系列最优动作。

反向归纳解释

自从 John von Neumann 和 Oskar Morgenstern 在 1944 年出版他们的著作《Theory of Games and Economic Behavior》时将博弈论确立为一门学术学科以来,就一直使用反向归纳来解决博弈。

在游戏的每个阶段,反向归纳决定了在游戏中走最后一步的玩家的最优策略。然后,确定倒数第二个移动玩家的最佳动作,将最后一个玩家的动作作为给定的。该过程向后继续,直到确定了每个时间点的最佳操作。实际上,一个是确定原始博弈的每个子博弈的纳什均衡。

然而,从反向归纳推断的结果通常无法预测实际的人类游戏。实验研究表明,“理性”行为(如博弈论所预测的)很少在现实生活中表现出来。如蜈蚣博弈所示,非理性玩家实际上可能最终获得比反向归纳预测的更高的收益。

在蜈蚣游戏中,两名玩家交替有机会从越来越多的底池中分得更多,或者将底池传给另一位玩家。收益的安排是这样的,如果将底池传给对手,而对手在下一轮拿下底池,则与本轮拿下底池相比,一个人获得的底池略少。一旦玩家拿走藏匿处,游戏就结束,该玩家获得较大的部分,而另一个玩家获得较小的部分。

反向归纳示例

举个例子,假设 Izaz 先走,并且必须决定他们是应该“拿走”还是“通过”目前价值 2 美元的藏匿处。如果他们接受,那么 Izaz 和 Jian 各得到 1 美元,但如果 Izaz 通过,现在必须由 Jian 决定接受或通过。如果Jian 拿走,他们会得到3 美元(即之前的2 美元+1 美元),而Izaz 得到0 美元。但是如果Jian 传球,Izaz 现在就可以决定是接球还是传球,依此类推。如果两个玩家总是选择通过,他们每个人都会在游戏结束时获得 100 美元的回报。

游戏的重点是,如果 Izaz 和 Jian 都配合并继续通过直到游戏结束,他们将获得每人 100 美元的最高奖金。但是,如果他们不信任其他玩家并期望他们在第一次机会时“接受”,则纳什均衡预测玩家将获得尽可能低的要求(在这种情况下为 1 美元)。

这场博弈的纳什均衡,即没有玩家在考虑对手的选择后有偏离他们选择的策略的动机,表明第一个玩家会在游戏的第一轮拿到底池。然而,实际上,很少有玩家这样做。结果,他们获得了比均衡分析预测的更高的回报。

使用反向归纳解决顺序博弈

下面是两个玩家之间的简单顺序游戏。其中包含玩家 1 和玩家 2 的标签分别是玩家一或二的信息集。树底部括号中的数字是每个点的收益。游戏也是顺序的,所以玩家 1 做出第一个决定(左或右),玩家 2 在玩家 1 之后做出决定(上或下)。

与所有博弈论一样,反向归纳法使用理性和最大化的假设,这意味着参与者 2 在任何给定情况下都会最大化他们的收益。在任一信息集中,我们都有两个选择,总共四个。通过消除玩家 2 不会选择的选项,我们可以缩小树的范围。通过这种方式,我们将在给定信息集上将玩家的收益最大化的线标记为蓝色。

在这个减少之后,既然玩家 2 的选择是已知的,那么玩家 1 可以最大化其收益。结果是由玩家 1 选择“正确”和玩家 2 选择“向上”的反向归纳找到的均衡。下面是游戏的解决方案,平衡路径加粗。

例如,使用公司作为玩家可以轻松地设置类似于上述游戏的游戏。这个游戏可能包括产品发布场景。如果公司 1 想要发布产品,公司 2 会怎么做?公司 2 会发布类似的竞争产品吗?通过预测这种新产品在不同场景下的销售情况,我们可以建立一个游戏来预测事件可能会如何展开。下面是一个如何建模这样一个游戏的例子。