智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: 傻傻的鱼
打印 上一主题 下一主题

想学GTO

[复制链接]
1#
JCreeks11 发表于 2017-2-7 18:23:57 | 显示全部楼层
上面一堆人在不懂装懂。GTO其实不是帮你盈利的,而是帮你不输钱的。GTO说白了是让你漏洞最少。

石头剪子布这个游戏,GTO就是你每一把都随机出一个,因为如果你任何不随机的行为都会被对手利用。可是很显然GTO不一定在所有情况下剥削对手EV最优的。每把随机出甚至不能够剥削对手傻傻地只出石头。

如果对手是鱼,或者没有针对你的打法调整的能力,GTO是没有意义的。比如石头剪子布,GTO其实对上再傻的对手都没有盈利。如果对手不会根据你的出法调整攻击你,你是应该偏离GTO的。比如你发现对手在出完剪子后出石头概率大,你就应该在对手出剪子后出布。
2#
JCreeks11 发表于 2017-2-7 23:13:01 来自手机 | 显示全部楼层
大家当然有质疑我的权利。我是常青藤应用数学的博士。
3#
JCreeks11 发表于 2017-2-7 23:19:18 来自手机 | 显示全部楼层
那些觉得自己懂GTO的人,请讲讲石头剪子布这个游戏的GTO是什么。
4#
JCreeks11 发表于 2017-2-8 01:25:53 来自手机 | 显示全部楼层
keybattle 发表于 2017-2-7 23:40
各1/3概率随机出。。。。



呵呵
5#
JCreeks11 发表于 2017-2-8 02:48:43 来自手机 | 显示全部楼层
keybattle 发表于 2017-2-7 23:40
各1/3概率随机出。。。。



霍老师明白人。

石头剪子布也可以有死钱,大家商量好一句石头剪子布赌多少钱即可。

你知道各1/3概率出的结论,请您用您的定义推导一下。

我只问一句,各1/3概率出这个策略怎么盈利,对什么策略盈利。
6#
JCreeks11 发表于 2017-2-8 03:28:03 来自手机 | 显示全部楼层
keybattle 发表于 2017-2-8 03:09
不跟你掐架了。 好好讨论。

我不知道为什么你纠结于剪刀石头布。 这个跟德州有太多本质上的不同, 我觉得 ...

据我所知,libratus 用的是近乎纳什均衡,也就是所谓GTO的策略,而非盯着对手弱点剥削的策略。在我的认识世界里,GTO和最大化剥削对手里一定联系,但说的两回事。我并不认为自己认识有误。

我认为打好扑克不学GTO也是可以的,但GTO确实需要一点数学基础。无限扑克的GTO要全部解出来不太可能,正如找到围棋必胜策略不太可能。现在AI对GTO算是一种逼近。

我说我的学历,当时被人质疑一时兴起说的。可能有些不妥,那我收回。其实我觉得学历跟话语权没有必然联系,大家应有平等争论质疑的权利。我的研究并非博弈论,研究领域有所相关但不一样。

其实扑克应该是长期大量样本盈利才是真理。口舌之争毫无意义,学到东西才最重要。我欢迎有人提出对GTO不同见解,最好能说出所以然来。
7#
JCreeks11 发表于 2017-2-8 03:32:51 来自手机 | 显示全部楼层
keybattle 发表于 2017-2-8 03:09
不跟你掐架了。 好好讨论。

我不知道为什么你纠结于剪刀石头布。 这个跟德州有太多本质上的不同, 我觉得 ...

回到楼主的问题,我同意线上扑克确实需要对range, bet size有更精确的认识。但直接上GTO有点门槛太高。不妨从寻找自己每一个打法的漏洞开始。比如cbet 100% 满锅显然不是GTO的,因为对手任意两张牌只要flop中了对子就跟既可以剥削我们。
8#
JCreeks11 发表于 2017-2-8 03:41:58 来自手机 | 显示全部楼层
keybattle 发表于 2017-2-8 03:09
不跟你掐架了。 好好讨论。

我不知道为什么你纠结于剪刀石头布。 这个跟德州有太多本质上的不同, 我觉得 ...

石头剪子布也是非完全信息游戏的一种,是个最简单的例子。如果说石头剪子布不能盈利,两个绝对正确的人打扑克也是互相不能盈利的。如果了解GTO的人,应该能把这个最简单的例子讲清楚。
9#
JCreeks11 发表于 2017-2-8 05:44:20 来自手机 | 显示全部楼层
keybattle 发表于 2017-2-8 04:18
我这么回答你吧。

为什么说两个绝对正确打牌的人是可以有盈利能力的差别。 所谓绝对正确, 我们把他定义 ...

我承认说GTO是为了不输钱确实有误导成分。想不输钱不玩就是了。通俗地理解,GTO最终还是为了自己EV最大化服务的,但前提是对手是非常聪明能针对我们打法调整的。我说不输钱是强调对手非常聪明这个前提,你说剥削是强调EV最大化。

你这个例子我觉得这样定义“绝对正确”不合理。因为可以构造偏离GTO而EV反而比“绝对正确”高的打法。
10#
JCreeks11 发表于 2017-2-8 19:40:28 来自手机 | 显示全部楼层
yyy6 发表于 2017-2-8 10:56
那AI不是盈利了吗?为啥说学GTO是不能帮助盈利或者不输钱呢?事实上扑克的GTO和石头剪刀布完全不一样,石 ...

首先,这世上有很多功夫,GTO可算金钟罩。降龙十八掌可能不是GTO,但对很多人也盈利。不一定非要练一门功夫。

谁都知道练成金钟罩铁布衫别人打不过,那么怎么练这套功夫呢?要算清楚GTO,仅仅会算一些简单的河牌模型列几个方程求个导是远远不够的,AI也是通过海量自我学习逼近GTO。那么怎么自我调整逼近GTO呢?

现在有两种调整方法。一种是每次跟对手打完后,反省自己是不是这样打可以增加盈利,下次调整再试。一种是每次打完以后,反省自己是不是这样打可以减少亏损,下次调整再试。

我现在宣称,前一种方法,不会让自己逼进GTO,有可能让自己远离GTO。后一种学习方法,更容易接近GTO。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-5-7 21:04 , Processed in 0.045500 second(s), 8 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部