查看: 1885|回复: 8

[推理资料] 囚徒困境与纳什均衡。

简洁模式
发表于 2013-6-23 16:09:14 | 显示全部楼层
这个定义是在经济学原理里会学到的东西。可是对分析犯罪也有点用。吧。我自己写不出来那么专业的讲解来,所以,我把老师的课件打出来看一下吧。我觉得用于推理挺有用的。

1950年,斯坦福大学客座教授、数学家为形象的说明博弈过程,构造了著名的囚徒困境模型。


两个嫌犯甲和乙作案后被警察抓住,隔离审讯。规则是,

如果两个人都坦白,那么各判八年。

如果一个人坦白一个人不坦白,那坦白的那个放出去,不坦白的那个要判15年。 (好草率的警察)

如果都不坦白,则各判一年。

如果你是那个嫌犯,你会选择合作还是背叛?

怎么做表格啊。。。。没有啊。还有那个所见即所得是什么玩意。算了。不用数据了。直接文字分析吧。反正也没人看。没人看。

从表面上看,两个人应该相互合作,保持沉默。但他们不得不考虑对方会怎么做。囚徒困境的模型的前提就是参与者都是利己的,都会要求自身利益最大化。囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。
好像是跑题了 。所以甲会这样子推理,加入乙不招,我找了,可以立即获得自由,而不招则会被判一年,那么显然招比不招好。但是假如乙招了而我没招,要做15年,而现在我招了,只判10年。显然,无论乙招与不招,我都招了。而且。乙也会这么想、

所以,个体的理性会导致双方得到的比可能得到的少,这就是困境所在。

启示1   在囚徒困境中的最佳策略直接取决于对方的策略,特别是取决于这个策略为发展双方合作留出多大的余地。独立于对方策略之外的最佳策略是不存在的。

启示2   从个人角度上来说,背叛是最好的选择,但双方的背叛可能会导致不甚理想的结果出现。

两个人都选择背叛,对个人来说是最佳的。照博弈论的说法,这是本问题的唯一平衡点,只有在这一点上,任何一方单方面改变选择,他只能得到较差的结果。这一点就是纳什平衡。

而走出这个困境的三个途径:
1.  使得未来相对于现在更重要些。
2. 改变对策者的四个可能结果的收益值、(决定合作与否取决于一次博弈还是多次博弈。)
3. 交给对策者那些促进合作的准则、事实和技能。

如何利用囚徒困境。。

如果没有外部强制力,这时囚徒困境中的两个参与者采取什么策略才能更好的维持合作的稳定性呢。如果一方采取不合作的策略并且永远采取不合作策略,这个在博弈论中称之为触发策略。如果对方知道你选择的是触发原则,那么对方不敢采取不合做策略,双方便陷入了永远不合作的境地。因此,一旦有人采取触发策略,那么双方都愿意选择合作策略、

然后触发策略。。。。突然感觉我写的和推理没多大关系哈。。编辑你会让我过吗。。打字很辛苦的好吗。
本主题帖为【历史主题】,仅楼主发布内容可以浏览。
尚未登录
您需要登录后才可以回帖 登录 | 加入学院