反复囚徒困境
什么是迭代囚徒困境?
迭代囚徒困境是一般形式的延伸,只是游戏由相同的参与者重复进行。重复囚徒困境与囚徒困境的原始概念不同,因为参与者可以了解对方的行为口头倾向。
反复出现的囚徒困境有时被称为和平-战争博弈。
理解迭代囚徒困境
由于游戏是重复的,一个人可以制定一个不遵循孤立回合的常规逻辑惯例的策略。以牙还牙是一种常见的迭代囚徒困境策略。
反复囚徒困境博弈是许多人类合作和信任理论的基础。基于游戏可以对需要信任的两个人之间的交易进行建模的假设,群体中的合作行为可以由游戏的多人迭代版本建模。
多年来,游戏背后的理论吸引了许多学者。最近,组织设计研究人员使用该游戏对企业战略进行建模。囚徒困境现在也很普遍,因为博弈论越来越受到投资策略师的欢迎。全球化和一体化贸易进一步推动了对能够描述地缘政治问题的金融和运营模式的需求。
迭代囚徒困境博弈示例
例如,您和一位同事在监狱中并涉嫌犯罪。你们彼此孤立,不知道对方会如何回应提问。警方邀请你们双方将对方牵连到犯罪(缺陷)中。会发生什么取决于你们俩都做了什么,但你们都不知道对方会如何回应。
如果您的同事在您保持沉默的情况下背叛了您(屈服于背叛的诱惑),那么您将获得最长的刑期,而您的同事却逍遥法外(反之亦然)。如果你们都选择通过保持沉默来相互合作(而不是警察),那么没有足够的证据证明你们俩都被定罪,所以你们都会因较轻的罪行而被轻判。如果你们俩都决定背叛,那么你们就已经谴责对方的刑罚略有减轻,但仍然很重。
这个游戏的回报是对非常好、相当好、相当差或非常差的刑期减刑,转化为积分系统如下:
游戏会反复进行数轮,直到结束(就好像你因不同的罪行被反复审讯一样)。每一轮的分数都是累积的,所以目标是在比赛结束前优化分数。游戏结束是在 1 到 100 轮之间随机确定的。在游戏结束时,分数被转换为最好分数的百分比。