智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: RichZhu
打印 上一主题 下一主题

GTO(所谓的“博弈论最优”)通俗版

[复制链接]
1#
maomaobiao 发表于 2015-11-30 10:34:51 | 显示全部楼层
老大挖坑了,我当然要跳,虽然姿势比较奇怪。

首先,我是反对动辄就提GTO的,GTO本身的原意可能是寻找动态平衡中的一个均衡策略点,这是我读老大的帖子体会到的。但是,

1)老大首先指出了,由于扑克游戏的变化多样,在一个动态变化的平衡中(即使是两人对局),这样的均衡可能是很容易被打破的,这就不存在某种意义上的金钟罩铁布衫。而这中最优的策略本身就涉及到针对性的调整的反应速度,每个人调整的速度和反应时间又是不同的,所以很可能寻找这样的均衡点,很可能是一厢情愿的举动。

2)即使在一个相当简化的模型,如囚徒困境中,也存在一个与现实严重不符合的假设,就是信息是封闭而不开放的。很多人注意到了囚徒困境中的“不合作”原则,这个原则运用的前提就是,对于两个囚徒而言,信息是封闭的,他们不可能知道对手的策略,也不能互动。先说囚徒困境,这其实无伤大雅,因为两个囚徒知不知道对方的策略,除非可以商量合作,否则最优解其实都是一定的。但是回到现实中来,我们是要把“不合作”与“信息封闭”当作两个条件来看的。因为在扑克这种博弈规则中,“不合作”可以认为是普遍适用的原则(极少的情况除外),但是“信息封闭”却是不存在的情况。博弈的双方在错综复杂的情况下,都或多或少地知道对方的策略,甚至为了迷惑对手,故意showdown bluff的情况屡见不鲜。在这样的原则下,寻找GTO,为什么对手就不能有GTO呢?奇怪,好像回到老大的思路上去了,就是GTO到底是矛还是盾,能不能以子之矛攻子之盾呢?相信大家心里都有自己的答案。

3)在许多简单的对局里,运用GTO其实是可行的。至于叫什么名字,就无所谓了吧。
2#
maomaobiao 发表于 2015-11-30 10:39:03 | 显示全部楼层
RichZhu 发表于 2015-11-30 07:09
(三)GTO这个词汇的是与非

本文开头说了,GTO这个词汇不但本身被用得越来越乱,还殃及到其它技术词汇的正 ...

没错equilibrium 是动态的平衡,optimum 是最优的方案,二者其实差别很大。
3#
maomaobiao 发表于 2015-11-30 12:39:00 | 显示全部楼层
本帖最后由 maomaobiao 于 2015-11-30 14:40 编辑
我是Jsli 发表于 2015-11-30 14:14
毛表哥包括吉米这里对纳什均衡有误解(这里不说gto)
纳什均衡不是矛与盾的问题
是互斗的双方可以处于一个 ...

这个“互利”的说法也是不准确的,因为

1)双方都不知道对方的决策,也不能商量

2)决策的标准只是对自己有利,所谓有理性的经济人

我提到的矛与盾是在2)的基础上针对GTO粉丝宣扬自己的说法(存在“无法被打败,无法被挖掘更大价值”的策略)提出质疑的方案,而并不是质疑GTO或者纳什均衡本身。
4#
maomaobiao 发表于 2015-12-1 06:19:51 | 显示全部楼层
jimmyking 发表于 2015-11-30 01:48
對於這種通俗的討論,非常的適合我,所以也來說幾句。

我想gto用在撲克中,最通俗的說法,就是“你吹我唔 ...

又看了一遍富贵和Jimmy的帖子。

尤其是这一楼,很赞!大道至简啊
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-6-12 01:58 , Processed in 0.040656 second(s), 9 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部