心连心鲜花网 加入收藏  -  设为首页
您的位置:心连心鲜花网 > 知识百科 > 正文

目录

1,囚徒困境原理是什么意思?

囚徒困境原理是什么意思?

囚徒困境原理是什么意思?
两个囚徒为了追求各自的利益最大化,得到的结果一定是两败俱伤;如果双方可以同时放弃各自的最优策略,选择合作,这样才可以双赢。所谓困境,在于如果任何一方选择了合作而对方不合作,己方将万劫不复;而如果对方选择合作而自己选择最优策略,自己则有机会一步登天,将万劫不复留给对方,这就是为什么即使双方都知道唯有合作才能双赢,双方仍然无法合作。
经济学中的“囚徒困境”是什么意思?
囚徒困境(Prison Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。

在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。



囚徒困境的主旨为,囚徒们虽然彼此合作,坚不吐实,可为全体带来最佳利益(无罪开释),但在资讯不明的情况下,因为出卖同伙可为自己带来利益(缩短刑期),也因为同伙把自己招出来可为他带来利益,因此彼此出卖虽违反最佳共同利益,反而是自己最大利益所在。但实际上,执法机构不可能设立如此情境来诱使所有囚徒招供,因为囚徒们必须考虑刑期以外之因素(出卖同伙会受到报复等),而无法完全以执法者所设立之利益(刑期)作考量。

举个例子:

1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。

若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。

若二人都互相检举(互相“背叛”),则二人同样判监2年。

用表格概述如下:

甲沉默(合作) 甲认罪(背叛)

乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年

乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
《博弈圣经》囚徒困境的定义是什么?
《博弈圣经》囚徒困境的定义;囚徒困境中的两点一空间,堪称大自然的三维时空游戏,它会引起两个灵性对三维实体变异的思考、也会引起对三维实体错位的焦虑。

……

【摘要】

最终纳什的家人和朋友、决定将他送进医院治疗,在医院他认为医生是苏联人、要追杀他。经医生诊断,他得的“妄想型精神分裂症”也更加严重。一个被“妄想型精神分裂症”伤害的大脑、一个胡言乱语的精神病人、妄想出来的“纳什均衡”博弈占优理论,你们认为可信吗?

……

来源:美国资讯网;博弈圣经著作人对纳什的嘲讽

博弈圣经著作人的经典名句;0、1、二维平均,称平衡,0、1、2、三维平均,称均衡。

在0、1、二维记录的系统中,0、1、这两种输赢粒子,必需构成博弈程序中的基本单元,冯·诺伊曼发现,有一个“极小极大定理”存在其中,(极小极大定理,就是要么极端的输、要么极端的赢),从长远来看,两种粒子出现的一次平均、是一次平衡,多次平均、就是多次平衡,里面并不存在两种粒子扯平的趋势。两种粒子的未来、不受过去所发生的、任何粒子事件的影响。0、1、两种粒子趋于平衡的预期,已经被极小极大定理彻底否决。

在0、1、二维粒子随机走动的系统中,只存在平均、不存在平均律,也就是不存在三维均衡。博弈圣经著作人的经典名句;策略,就不存在0、1、二维系统中。纳什均衡提出时,当场就遭到冯·诺依曼的贬低、嘲笑和断然否定。

谈到“纳什均衡”,有位记者请纳什用通俗的语言来解释他的理论。纳什说;“‘纳什均衡’并不高深,它就像中国人发明的一种、三个人玩的扑克游戏,“纳什均衡”就是一个简单的三人博弈游戏”。中国有那么多人玩扑克,又玩了那么多年,纳什还提醒了中国人半个多世纪,纳什均衡并不高深,中国人竟没有一个人发现三个人玩的扑克游戏中、还有一个‘均衡占优理论’。人们不禁要问;纳什他自己玩过几次三人扑克游戏?他和谁玩的?他是怎么发现的均衡?均衡理论又是怎么单方占优的?在他所有的文章中,为什么没有对中国的扑克游戏展开叙述。一副扑克三个人玩,一个人18张牌,在连续记录的0、1、2、三维系统中,18张牌只能记录成、18个红蓝小点而已,它是怎么个均衡法呢?他在60多年的时间里,没有人见过他、用中国的扑克表演过什么是、非合作纳什均衡,什么是纳什均衡占优策略,他既没有实际表演,也没有给出明确的理论说明,这令关注纳什占优策略的人,大为失望。

博弈圣经著作人的经典名句;科学家在纳什均衡理论中、尚未发现博弈占优策略的任何迹象。

博弈圣经著作人的经典名句;策略,来自0、1、2、三维结构的自然属性。粒子、私湍、实体,简称为,粒、湍、体。它是博弈取胜、计算单方占优策略的标准模型。

在纳什的语文学中,就没有出现过一次0、1、2、三维均衡的概念,纳什均衡哪里来。

博弈圣经著作人的经典名句;纳什均衡理论没有任何明确的说法,纳什均衡是美国伪造的产物,传到了世界各地,当然也传遍了中国。“纳什均衡”的本质,是对中国人的智商,对发现、发明、创造精神的一种羞辱。

博弈圣经著作人的经典名句;二维平衡是指生物的竞争行为,三维均衡是指自然的优劣特性。

博弈圣经著作人的经典名句;揭开纳什均衡的画皮,露出真相。【如果纳什均衡是以纳什的名字、命名的一个博弈论术语;假如我把纳什名字去掉、只剩下均衡一词、均衡也就是纯净的博弈论术语;倘若所有博弈论的文章中、都把纳什名字去掉只剩下均衡;再读一篇篇博弈论文章、也都是围绕着均衡一词展开的叙述;发现通篇文章逻辑不通、词意变异、不知所云;只要是属于纳什均衡的理论文章、去掉纳什名字之后、纳什的鬼魅就出现了;通篇文章,捕风捉影、张冠李戴、以讹......
什么是囚徒困境
囚徒困境的故事讲的是,两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。警察告诉每个人:如果两人都抵赖,各判刑一年;如果两人都坦白,各判八范;如果两人中一个坦白而另一个抵赖,坦白的放出去,抵赖的判十年。于是,每个囚徒都面临两种选择:坦白或抵赖。然而,不管同伙选择什么,每个囚徒的最优选择是坦白:如果同伙抵赖、自己坦白的话放出去,不坦白的话判一年,坦白比不坦白好;如果同伙坦白、自己坦白的话判八年,不坦白的话判十年,坦白还是比不坦白好。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。
什么是囚徒困境?
什么是囚徒困境呢?它的具体内容是什么呢?   囚徒困境简介  囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。  单次发生的囚徒困境,和多次重复的囚徒困境结果不会一样。  在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。  经典的囚徒困境  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。  若二人都互相检举(互相“背叛”),则二人同样判监2年。  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:  若对方沉默、背叛会让我获释,所以会选择背叛。  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
囚徒困境现象告诉我们什么?
囚徒困境现象告诉我们:个人理性和集体理性之间存在矛盾,个人理性的正确选择会降低大家的福利。

2,囚徒困境的原理是什么?

案例研究 囚犯两难处境的比赛
假想你正与被关在另一个屋子里的“嫌疑”人进行囚犯两难处境的博弈。而且,再设想这种博弈不是进行一次而是多次。你博弈最后的得分是你被监禁的总年数。你希望使这种得分尽可能地少。你应该用什么战略?你应该从坦白还是保持沉默开始?另一个参与者的行动会如何影响你以后的坦白决策?
多次的囚犯两难处境是极为复杂的博弈。为了鼓励合作,参与者应该相互惩罚不合作行为。但以前描述的杰克和吉尔的水卡特尔的战略——只要另一方违约,一方就永远违约——得不到宽恕。在反复许多次的博弈中,在不合作时期之后,允许参与者回到合作结果的战略,可能是较合人意的。
为了说明哪一种战略最好,政治学家罗伯特?阿克塞尔罗德(Robert Axelrod)进行了一场比赛。人们通过输人为反复进行囚犯的两难处境而设计的电脑程序进入比赛。每个进行博弈的程序都对应于所有其他程序。得到狱中总年数最少的程序的是“赢家”。
赢家结果是被称为一报还一报的简单战略。根据一报还一报,参与者应该从合作开始,然后上一次另一个参与者怎么作自己也怎么做。因此,一报还一报参与者要一直合作到另一方违约时为止;他违约到另一方重新合作时为止。换句话说,这种战略从友好开始,惩罚不友好的参与者,而且,如果对方改变就给予原谅。令阿克塞尔罗德惊讶的是,这种简单的战略比人们输人的所有较复杂的战略都好。

3,纳什理论为什么会使生物进化学有重大突破(美丽心灵里

纳什均衡”:合作是有利的“利己策略”。它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。1994年诺贝尔经济学奖的获得者美国普林斯顿大学的约翰·纳什。纳什获得诺贝尔经济学奖的原因是他在博奕沦领域的贡献,他提出了“纳什均衡”理论、关于博奕论,流传最广的是一个叫做“囚徒困境”的故事:话说有一天,一个富翁在家中被杀,财物被盗;警方在此案的侦破过程中,抓到两个犯罪嫌疑人张三和李四,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称他们只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。警察分别对张三和李四说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”张三和李四怎么呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐3个月,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招?结果都被判5年刑期。原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。实际上,如果两个都抵赖,各判刑1年,显然比都判5年好,但实际上做不到,因为它不满足个人理性要求。作为一个理性的人,张三和李四都会想,如果我抵赖而对方坦白的话,自己就可能判刑10年,理性的人是不会冒这种险的。但张三和李四都理性选择的结果,两人都被判了5年,最优的被判1年的结果并没有出现。也就是说,对每个人而言都是理性的选择,但对于整个集体来说却是不理性的。这与传统经济学所言的结论相悖。传统经济学认为市场经济存在“看不见的手”,它调节的结果是每个人的理性选择最终会造成对整个集体的最大利益。实际上,就像囚徒困境一样,这只看不见的手在参与选择的人数只有少数几个的时候会失去作用,因为这个时候,人们决策的过程会考虑其他参与者的想法,就像赌博和下棋的时候一样,这就和买家和卖家数量都巨大时的完全竞争不完全一样,需要新的一套思路进行研究。在上面的例子中,我们注意到了一个并非最优的结果,就是两人都选择坦白的策略以及因此被判5年的结果,这个结果被称为“纳什均衡”,也叫非合作均衡。博奕论中最基本的概念就是“纳什均衡”,一谈到博奕论,人们说的最多的最著名的也是“纳什均衡”。纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种均衡。当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。如上述,在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。同时,它也提示我们:合作是有利的“利己策略”。实际上,如果上述两个囚徒能够串供进行合作,那么他们一定会选择都抵赖从而只因偷盗罪被判1年,当然,正是考虑到了这一点,所以警察才对他们隔离审查从而获知了事实真相,对囚徒而言最有利的合作结果才没有出现。“纳什均衡”描述的就是一种非合作博奕均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博奕理论的重大发展,甚至可以说是一场革命。今天,纳什均衡被广泛应用于各个领域的研究,尤其在进行制度分析寸,我们可应用它得出一个很重要结论:一种制度(体制)安排要发生效力,必须是一种纳什均衡。否则,这种制度安排便不能成立

4,关于约翰纳什的博弈论

纳什均衡定义: 假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己效用最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。 纳什均衡经典案例:囚徒困境 (1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。) 假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。表2.2给出了这个博弈的支付矩阵。 表2.2 囚徒困境博弈 —————————————————————————— ┃ B ┃ B ┃ ————————┃————————┃————————┃ ┃ 坦白 ┃ 抵赖 ┃ ————————┃————————┃————————┃ A 坦白 ┃ –8, –8 ┃ 0, –10 ┃ ————————┃————————┃————————┃ A 抵赖 ┃ –10, 0 ┃ –1, –1 ┃ ————————┃————————┃————————┃ 关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年监狱,坦白最多才8年;他要是抵赖,我就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。 基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。 记载纳什生平的书有:《普林斯顿的幽灵》(又译为《美丽心灵》)西尔维娅.娜萨 再来看一段 纳什均衡理论的介绍 : 1994年诺贝尔经济学奖的获得者是美国普林斯顿大学的约翰·纳什。纳什获得诺贝尔经济学奖的原因是他在博奕沦领域的贡献,他提出了“纳什均衡”理论、关于博奕论,流传最广的是一个叫做“囚徒困境”的故事: 话说有一天,一个富翁在家中被杀,财物被盗;警方在此案的侦破过程中,抓到两个犯罪嫌疑人张三和李四,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称他们只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。警察分别对张三和李四说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。” 张三和李四怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐3个月,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招?结果都被判5年刑期。原本对双方都有利的策略(抵赖)和结局 (被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。 实际上,如果两个都抵赖,各判刑1年,显然比都判5年好,但实际上做不到,因为它不满足个人理性要求。作为一个理性的人,张三和李四都会想,如果我抵赖而对方坦白的话,自己就可能判刑10年,理性的人是不会冒这种险的。但张三和李四都理性选择的结果,两人都被判了5年,最优的被判1年的结果并没有出现。也就是说,对每个人而言都是理性的选择,但对于整个集体来说却是不理性的。 这与传统经济学所言的结论相悖。传统经济学认为市场经济存在“看不见的手”,它调节的结果是每个人的理性选择最终会造成对整个集体的最大利益。实际上,就像囚徒困境一样,这只看不见的手在参与选择的人数只有少数几个的时候会失去作用,因为这个时候,人们决策的过程会考虑其他参与者的想法,就像赌博和下棋的时候一样,这就和买家和卖家数量都巨大时的完全竞争不完全一样,需要新的一套思路进行研究。 在上面的例子中,我们注意到了一个并非最优的结果,就是两人都选择坦白的策略以及因此被判5年的结果,这个结果被称为“纳什均衡”,也叫非合作均衡。博奕论中最基本的概念就是“纳什均衡”,一谈到博奕论,人们说的最多的最著名的也是“纳什均衡”。纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种均衡。 当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。如上述,在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。 从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。同时,它也提示我们:合作是有利的“利己策略”。实际上,如果上述两个囚徒能够串供进行合作,那么他们一定会选择都抵赖从而只因偷盗罪被判1年,当然,正是考虑到了这一点,所以警察才对他们隔离审查从而获知了事实真相,对囚徒而言最有利的合作结果才没有出现。“纳什均衡”描述的就是一种非合作博奕均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博奕理论的重大发展,甚至可以说是一场革命。 今天,纳什均衡被广泛应用于各个领域的研究,尤其在进行制度分析寸,我们可应用它得出一个很重要结论:一种制度(体制)安排要发生效力,必须是一种纳什均衡。否则,这种制度安排便不能成立。(据《诺贝尔经济学奖经典理论》一书) 采纳哦