GTO（所谓的“博弈论最优”）通俗版

我是Jsli · 发表于 2015-11-29 13:21:05

必须说道说道

我是Jsli · 发表于 2015-11-29 13:58:50

维基百科-納什均衡點
納什平衡（英语：Nash equilibrium），又稱為非合作賽局平衡，是在非合作賽局（Non-cooperative game）狀況下的一個概念解，在博弈论中有重要地位，以约翰·納什命名。

如果某情況下無一參與者可以通过獨自行動而增加收益，則此策略組合被稱為納什均衡點[1]。

例子
其經典的例子就是囚徒困境。囚徒困境是一个非零和博弈。大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被立即释放，而对方将被判刑十年；如果两人均招供，将均被判刑两年。如果两人均不招供，将最有利，只被判刑半年。于是，两人同时陷入招供还是不招供的两难处境。但两人无法沟通，于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳什均衡点。这时，个体的理性利益选择是与整体的理性利益选择不一致的。

基于经济学中“理性经济人”的前提假设，两个囚犯符合自己利益的选择是坦白招供，原本对双方都有利的策略不招供从而均被判刑半年就不会出现。事實上，这样两人都选择坦白的策略以及因此被判两年的结局被稱作是“纳什均衡”（也叫非合作均衡），換言之，在此情況下，無一參與者可以「獨自行動」（即單方面改變決定）而增加收穫。

学术争议和批评
第一，纳什的关于非合作博弈论的平衡不动点解（equilibrium/fixpoint）学术证明是非构造性的（non-constructive），就是说纳什用角谷静夫不动点定理（英语：Kakutani fixed point theorem）证明了平衡不动点解是存在的，但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发现对现实生活里的博弈的作用是有限的，即使知道平衡不动点解存在，在很多情况下卻找不到，因此仍不能解决问题。

第二，纳什的非合作博弈论模型仅仅是突破了博弈论中的一个局限。一个更大的局限是，博弈论面对的往往是由几十亿节点的庞大对象构成的社会、经济等复杂行为，但冯·诺伊曼和纳什的研究是针对两三个节点的小规模博弈论（有人称之为tiny-scale toy case）。

这个假设的不完善处，可能比假设大家都是合作的更严重。因为在经济学里，一个庞大社会里的人极不可能全部都是合作的，非合作的情况通常在庞大对象的情形中更普遍，而在两三个节点的小规模经济中倒反而影响较小。既然改了合作前提为非合作前提，却仍然停留在两三个节点的小规模博弈论中，这是一个不可忽视的缺陷。MIT的一位计算机科学博士生的博士论文[2]——获得2008年度美国计算机协会学位论文奖——认为经济学家的推测是错误的，找到纳什均衡点是几乎不可能的事。目前担任MIT电机工程和计算机科学系助理教授的Constantinos Daskalakis与 UC伯克利的Christos Papadimitriou、英国利物浦大学的Paul Goldberg合作，证明对某些博弈来说，穷全世界所有计算机之力，在整个宇宙寿命的时间内也计算不出纳什均衡点。Daskalakis相信，计算机找不到，人类也不可能找到。纳什均衡属于NP问题，Daskalakis证明它属于NP问题的一个子集，不是通常认为的NP-完全问题，而是PPAD-完全问题。这项研究成果被一些计算机科学家认为是十年来博弈论领域的最大进展。

不過在同一篇論文裡，Daskalakis也指出，在參與者匿名的情況下，則僅需多項式時間即可逼近纳什均衡。

相關鏈接
《Non-Cooperative Games》,约翰 · 纳什 , The Annals of Mathematics 1951
Alfredo ougaowen最后编辑于6月前

我是Jsli · 发表于 2015-11-29 14:01:50

我是Jsli 发表于 2015-11-29 13:58
维基百科-納什均衡點
納什平衡（英语：Nash equilibrium），又稱為非合作賽局平衡，是在非合作賽局（Non-co ...

别说我歪楼呵
我是对这句话不理解,谷歌一下原意
纳什均衡理论，（Nash Equilibrium）大意是说：在非合作类博弈中，存在一种策略组合，使得每个参与人的策略是对其他参与人策略的最优反应。如果参与者当前选择的策略形成了“纳什均衡”，那么对于任何一位参与者来说，单方更改自己的策略不会带来任何好处。

我是Jsli · 发表于 2015-11-29 14:50:42

本帖最后由我是Jsli 于 2015-11-29 15:46 编辑

根据上面纳什均衡理论
扑克游戏中是否有gto？

这里以现金HU来说明
1.双方必须从自身利益为出发点.
2.双方对自身利益有明确的判断,并且可以自愿执行.
3.双方的行为对双方产生的利益相等.

双方筹码一样多,双方永远都不弃牌
这个是不是纳什均衡

当然因为扑克室的抽水
所以双方不打牌才是对双方最有利的
就好像2个罪犯都不承认犯罪

我是Jsli · 发表于 2015-11-29 15:43:30

刚才在路上把扑克中有关对gto认识的一个现象想明白了

再回到这个例子
其經典的例子就是囚徒困境。囚徒困境是一个非零和博弈。大意是：一个案子的两个嫌疑犯被分开审讯，警官分别告诉两个囚犯，如果你招供，而对方不招供，则你将被立即释放，而对方将被判刑十年；如果两人均招供，将均被判刑两年。如果两人均不招供，将最有利，只被判刑半年。于是，两人同时陷入招供还是不招供的两难处境。但两人无法沟通，于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳什均衡点。这时，个体的理性利益选择是与整体的理性利益选择不一致的。

这里有2点：
1.两个囚犯地位条件对等。设想如果其中一位的爹叫李钢，这个囚犯指定不认罪,因为他爹李刚能摆平.
2.双方自愿达成了这个平衡,任何一方试图不认罪都可能将自己置于更坏的境地.

而扑克双方条件是不对等的
大白话就是扑克水平有差别

所以现实扑克中
双方都愿意把把不弃牌这个纳什均衡的情况不会出现
双方都会想方设法脱离这个平衡

我是Jsli · 发表于 2015-11-30 06:15:50

我是Jsli · 发表于 2015-11-30 06:22:25

这样当我们讨论牌局的时候说“这是我认为的最佳策略”
我们指的是EV最大的选择,或者是BR允许下EV最大的选择
---------------
朱老大这句话解决了我一个长时间对扑克的困惑

EV最大选择-hero不同,最佳策略是相同的唯一的
BR允许下EV最大的选择-hero不同最佳策略不同

我是Jsli · 发表于 2015-11-30 12:14:31

maomaobiao 发表于 2015-11-30 10:34
老大挖坑了，我当然要跳，虽然姿势比较奇怪。

首先，我是反对动辄就提GTO的，GTO本身的原意可能是寻找动态 ...

毛表哥包括吉米这里对纳什均衡有误解(这里不说gto)
纳什均衡不是矛与盾的问题
是互斗的双方可以处于一个互利的状态

我是Jsli · 发表于 2015-11-30 12:25:43

我是Jsli 发表于 2015-11-30 12:14
毛表哥包括吉米这里对纳什均衡有误解(这里不说gto)
纳什均衡不是矛与盾的问题
是互斗的双方可以处于一个 ...

两个傻瓜HU
把把都不弃牌最接近扑克的纳什均衡
因为这个状态双方中的一方损失最小

我是Jsli · 发表于 2015-12-1 02:01:53

伟大的墙发表于 2015-11-30 12:36
老李神解读

墙爷
德州不就是弃牌的game吗

在其它条件相同的前题下
双方无限时间内都不弃牌
两个牌手只损失抽水吧

		自动登录	找回密码
密码			注册

GTO（所谓的“博弈论最优”）通俗版

本帖子中包含更多资源

客服中心

投诉建议