智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: 傻傻的鱼

想学GTO

[复制链接]
Howard 发表于 2017-2-8 02:10:39 | 显示全部楼层
以我对几个ID发帖历史的粗浅观察,楼上几位keybattle, 纯生,JCreeks11 对GTO都有相当深度的理解,具体到什么程度谁高谁低这个不好说也不是我发帖的主旨,我意思是几位里边不存在对GTO一无所知而信口胡言的。所以说到呛火纯粹是话赶话了,人身贬低没什么意义。

比如这里:“如果对手是鱼,或者没有针对你的打法调整的能力,GTO是没有意义的。”
我认为JCreeks说的“没有意义”意思是没有人会坚持GTO打法,对一个calling station还坚持every potsize bet has 2 nuts 1 bluff.

而纯生兄和keybattle大概把 “没有意义” 理解成 “不能盈利” 的意思了。因此会出言反驳。

我认为三位的共同特点是:
1. 都是赢家
2. 都有一定的数学和逻辑功底,在常识上不会犯错误

因此接下来的发帖就不要想着在常识上按死对方了。但是可以骂街,纯人身攻击,这玩意是没有对错的
JCreeks11 发表于 2017-2-8 02:48:43 来自手机 | 显示全部楼层
keybattle 发表于 2017-2-7 23:40
各1/3概率随机出。。。。



霍老师明白人。

石头剪子布也可以有死钱,大家商量好一句石头剪子布赌多少钱即可。

你知道各1/3概率出的结论,请您用您的定义推导一下。

我只问一句,各1/3概率出这个策略怎么盈利,对什么策略盈利。
keybattle 发表于 2017-2-8 03:09:55 | 显示全部楼层
JCreeks11 发表于 2017-2-8 02:48
霍老师明白人。

石头剪子布也可以有死钱,大家商量好一句石头剪子布赌多少钱即可。

不跟你掐架了。 好好讨论。

我不知道为什么你纠结于剪刀石头布。 这个跟德州有太多本质上的不同, 我觉得我只提死钱这一点不完整。

1. 就算你剪刀石头布放死钱, 长期是无法盈利的。 这个没有什么好说的。

2. 剪刀石头布先后顺序是无关的

3. 剪刀石头布是一个没有绝对大小的游戏。 德州,翻牌前AA就是统治其他所有牌。

4. 推荐一本书  https://www.amazon.com/Expert-He ... ative/dp/1904468942

5. 唯一同意你一点,低级别纠结GTO没有太多必要。 剥削策略明显更好, 更profitable。但是,完整理解GTO也是有好处的,这样你可以知道自己在什么时候通过偏离GTO去剥削对方。

6. 真正的GTO, 也没有人完全解出来,只能在每条街尽量接近,其中河牌应该是最容易求解的,因为没有了往下的树的分叉。 我不知道现在AI的打法有多接近GTO,你有兴趣可以看看这篇paper: https://www.cs.cmu.edu/~noamb/papers/17-AAAI-Refinement.pdf

7. 扑克论坛, 讨论东西, 丢一个藤校应数的PHD来坐正自己言论我觉得不太合适。不管你是真是假也好, 就我说的,GTO不需要一个应数PHD的头衔才是说搞得懂。 有应数PHD的头衔不代表你比别人懂得多,我想你应数PHD目前研究课题也不是什么imperfect-information game thoery的,
JCreeks11 发表于 2017-2-8 03:28:03 来自手机 | 显示全部楼层
keybattle 发表于 2017-2-8 03:09
不跟你掐架了。 好好讨论。

我不知道为什么你纠结于剪刀石头布。 这个跟德州有太多本质上的不同, 我觉得 ...

据我所知,libratus 用的是近乎纳什均衡,也就是所谓GTO的策略,而非盯着对手弱点剥削的策略。在我的认识世界里,GTO和最大化剥削对手里一定联系,但说的两回事。我并不认为自己认识有误。

我认为打好扑克不学GTO也是可以的,但GTO确实需要一点数学基础。无限扑克的GTO要全部解出来不太可能,正如找到围棋必胜策略不太可能。现在AI对GTO算是一种逼近。

我说我的学历,当时被人质疑一时兴起说的。可能有些不妥,那我收回。其实我觉得学历跟话语权没有必然联系,大家应有平等争论质疑的权利。我的研究并非博弈论,研究领域有所相关但不一样。

其实扑克应该是长期大量样本盈利才是真理。口舌之争毫无意义,学到东西才最重要。我欢迎有人提出对GTO不同见解,最好能说出所以然来。
JCreeks11 发表于 2017-2-8 03:32:51 来自手机 | 显示全部楼层
keybattle 发表于 2017-2-8 03:09
不跟你掐架了。 好好讨论。

我不知道为什么你纠结于剪刀石头布。 这个跟德州有太多本质上的不同, 我觉得 ...

回到楼主的问题,我同意线上扑克确实需要对range, bet size有更精确的认识。但直接上GTO有点门槛太高。不妨从寻找自己每一个打法的漏洞开始。比如cbet 100% 满锅显然不是GTO的,因为对手任意两张牌只要flop中了对子就跟既可以剥削我们。
JCreeks11 发表于 2017-2-8 03:41:58 来自手机 | 显示全部楼层
keybattle 发表于 2017-2-8 03:09
不跟你掐架了。 好好讨论。

我不知道为什么你纠结于剪刀石头布。 这个跟德州有太多本质上的不同, 我觉得 ...

石头剪子布也是非完全信息游戏的一种,是个最简单的例子。如果说石头剪子布不能盈利,两个绝对正确的人打扑克也是互相不能盈利的。如果了解GTO的人,应该能把这个最简单的例子讲清楚。
keybattle 发表于 2017-2-8 04:18:36 | 显示全部楼层
JCreeks11 发表于 2017-2-8 03:41
石头剪子布也是非完全信息游戏的一种,是个最简单的例子。如果说石头剪子布不能盈利,两个绝对正确的人打 ...

我这么回答你吧。

为什么说两个绝对正确打牌的人是可以有盈利能力的差别。 所谓绝对正确, 我们把他定义为bet size和bluff/value ratio perfectly balanced。

我们把GTO简化到河牌,假设底池100.

到河牌后,value combos数量是有限的。 我们假设为x combos.

Player A 每次到了这种情况,bet 100, value/bluff 2:1, 即value bet x combos, bluff 0.5x comobs.  放弃其他combos.

Player B 每次到了这种情况, bet 300, value/bluff 58:42, 即value bet x combos, bluff 0.72x combos, 放弃其他combos.

在河牌,player A 下注, player B indifferent to call or fold. Player B EV 0. Player A下注EV为底池的100
             player B 下注, Player A indifferent to call or fold. Player A EV 0. Player B下注EV为底池的100

但是,因为Player B可以加入更多的bluff combos.  0.72 > 0.5.  Player B在这种情况下, 拿到100 EV的频率更高。


其实这也是最近libratus crush人类的一部分原因,就是频繁的overbet的应用。
JCreeks11 发表于 2017-2-8 05:44:20 来自手机 | 显示全部楼层
keybattle 发表于 2017-2-8 04:18
我这么回答你吧。

为什么说两个绝对正确打牌的人是可以有盈利能力的差别。 所谓绝对正确, 我们把他定义 ...

我承认说GTO是为了不输钱确实有误导成分。想不输钱不玩就是了。通俗地理解,GTO最终还是为了自己EV最大化服务的,但前提是对手是非常聪明能针对我们打法调整的。我说不输钱是强调对手非常聪明这个前提,你说剥削是强调EV最大化。

你这个例子我觉得这样定义“绝对正确”不合理。因为可以构造偏离GTO而EV反而比“绝对正确”高的打法。
输神 发表于 2017-2-8 09:23:14 | 显示全部楼层
今天大家在群里讨论一个问题,一滴水从万米高空掉下来,威力有多大?砸到人会不会死?顿时群里热闹了,有大学生,研究生,博士生一起讨论了两个钟头,然后我说了一句:你们没被雨淋过吗?然后,群里安静了,再然后,我被踢出了QQ群。

不就是怎样博弈才最优么,大家又何必把简单的问题搞的那么复杂。
Howard 发表于 2017-2-8 09:27:50 来自手机 | 显示全部楼层
输神 发表于 2017-2-7 19:23
今天大家在群里讨论一个问题,一滴水从万米高空掉下来,威力有多大?砸到人会不会死?顿时群里热闹了,有大 ...

依我看大家搞的复杂度还远远远远不够。连必须的复杂度的万亿分之一都远不到。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-3-29 14:07 , Processed in 0.046471 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部