智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: 傻傻的鱼

想学GTO

[复制链接]
yyy6 发表于 2017-2-8 10:56:45 | 显示全部楼层
JCreeks11 发表于 2017-2-8 03:28
据我所知,libratus 用的是近乎纳什均衡,也就是所谓GTO的策略,而非盯着对手弱点剥削的策略。在我的认识 ...

那AI不是盈利了吗?为啥说学GTO是不能帮助盈利或者不输钱呢?事实上扑克的GTO和石头剪刀布完全不一样,石头剪刀布是不输钱且不盈利,但扑克是至少不输钱,几乎一定盈利。如果人真能用完全的GTO,在任何级别都能盈利,这个跟对手会不会调整没有关系。你只能说他不会是ev最大化策略罢了。但级别越高GTO就越接近ev最大化策略。
 楼主| 傻傻的鱼 发表于 2017-2-8 10:59:33 来自手机 | 显示全部楼层
@keybattle @jcreeks 二位说的对我都有启发,Agent K偏重实战,J偏理论,MIB这是。 绝大多数人只想只能学点实战应用,理论搞不了。我打算先根据range和sizing 分析下最近10万手NL25的牌,争取掌握点皮毛,这里谢过K!软件只有flopzilla ,够用吗?
snowsnow 发表于 2017-2-8 11:00:14 | 显示全部楼层
输神 发表于 2017-2-8 09:23
今天大家在群里讨论一个问题,一滴水从万米高空掉下来,威力有多大?砸到人会不会死?顿时群里热闹了,有大 ...

今天大家在群里讨论一个问题,一滴水从万米高空掉下来,威力有多大?砸到人会不会死?顿时群里热闹了,有大学生,研究生,博士生一起讨论了两个钟头,然后我说了一句:你们没被雨淋过吗?然后,群里安静了,再然后,我被踢出了QQ群。


snowsnow 发表于 2017-2-8 11:05:55 | 显示全部楼层
GTO play is essentially a defensive strategy, not the maximally profitable one.

说GTO不能帮助盈利本身说不通, 他只是说不是考虑最大盈利。
避免风险 > 考虑最大盈利。
青岛纯生 发表于 2017-2-8 13:38:37 | 显示全部楼层
yyy6 发表于 2017-2-8 10:56
那AI不是盈利了吗?为啥说学GTO是不能帮助盈利或者不输钱呢?事实上扑克的GTO和石头剪刀布完全不一样,石 ...

把大神都炸出来了哈哈
 楼主| 傻傻的鱼 发表于 2017-2-8 14:53:40 | 显示全部楼层
现学现问。

PokerStars - $0.25 NL (6 max) - Holdem - 4 players
Hand converted by PokerTracker 4

CO: 181.64 BB (VPIP: 29.73, PFR: 20.27, 3Bet Preflop: 11.76, Hands: 76)
BTN: 108.08 BB (VPIP: 25.76, PFR: 19.67, 3Bet Preflop: 10.38, Hands: 1,678)
Hero (SB): 159.64 BB
BB: 104.04 BB (VPIP: 25.56, PFR: 20.00, 3Bet Preflop: 8.45, Hands: 184)

Hero posts SB 0.4 BB, BB posts BB 1 BB

Pre Flop: (pot: 1.4 BB) Hero has  J K

fold, BTN raises to 3 BB, Hero raises to 10 BB, fold, BTN calls 7 BB

Flop: (21 BB, 2 players)  6 5 T
Hero checks, BTN checks

Turn: (21 BB, 2 players)  J
Hero bets 13.36 BB, BTN calls 13.36 BB

River: (47.72 BB, 2 players)  9
Hero checks, BTN bets 34.16 BB, Hero calls 34.16 BB

BTN shows  K Q  (Straight, King High)
(Pre 69%, Flop 87%, Turn 25%)
Hero mucks  J K  (One Pair, Jacks)
(Pre 31%, Flop 13%, Turn 75%)
BTN wins 112.04 BB


这手牌,用GTO的思路是不是应该这样分析。
1:V BET 34.1/(47.72+34.1)=42% 的RANGE. V是标准的REG,2000手数据。F 3BET 83%,所以他的RANGE 88+;BROADY WAY.大约72COMBOS  72*0.42=32COMBO=QQ

2:HERO 需要DEFEND 1-0.42=58%.   我的3BET 数据不到10%。我的RANGE 大概有87COMBS.    87*0.58=50COMBOS=AJ+KJs.

如果单纯从我自己的RANGE 来看,我这里CALL没有问题,  然而这里由于V和Hero的RANGE是完全重叠的, 显然我们排名50的要弱于V前30,因此这种情况下的GTO应该去匹配对手的RANGE. 也就是QQ+必须得CALL. KJ必须得FOLD.     

接下来下面这手牌:
PokerStars - $0.25 NL (6 max) - Holdem - 2 players
Hand converted by PokerTracker 4

BB: 100 BB
Hero (SB): 100 BB

Hero posts SB 0.4 BB, BB posts BB 1 BB

Pre Flop: (pot: 1.4 BB) Hero has  A T

Hero raises to 2.48 BB, BB raises to 8 BB, Hero calls 5.52 BB

Flop: (16 BB, 2 players)  4 3 6
BB bets 11.6 BB, Hero calls 11.6 BB

Turn: (39.2 BB, 2 players)  J
BB bets 80.4 BB and is all-in, fold

BB wins 37.44 BB


这是在6人桌上的HU(PS越来越不像话了,今天我16桌开了半小时都开不满,这桌只坐了2个人) 无交手历史,无数据,第一手牌。
当时打的时候直觉对手在BLUFF,  JJ-AA直接排除。 有对7的话我就CALL了。

用GTO的思路计算:
1:V bet 80.4/80.4+39.2=67%    默认他的3BET RANGE 10%(考虑到是HU) ,根据FLOP 和TURN的动作,排除掉JJ-AA+,增加76 57ss。剩下大概76COMBOS.      提名第51的是A high=AQ.
2:hero 需要defend 33% 也就是前29名的COMBO.  =TT         

我的疑问来了, 我们的29名远远强于对手的51名。  是不是应该放松CALLING RANGE到AK甚至AQ。   


结合以上两手。我的想法是,我们Defend range的BOTTOM要和V RANGE的BOTTOM要在同一个牌力范围之内(类似OVER 2 OVER,TP 2 TP,),如果双方的BOTTOM牌力相差大的话,V VALUE RANGE 占多数的时候要就高不就低,  V BLUFF RANGE 占多数的时候要就低不就高。

以上思路和观点是否正确, 求指点。
1025 发表于 2017-2-8 15:10:53 | 显示全部楼层
期待后续
gulugulubing 发表于 2017-2-8 15:42:41 来自手机 | 显示全部楼层
傻傻的鱼 发表于 2017-2-8 14:53
现学现问。

PokerStars - $0.25 NL (6 max) - Holdem - 4 players

额 不太懂唉。首先对手为啥是这个范围呢?
然后你这把对手范围都基本确定了  你call或者fold的ev哪个高不就确定了么 还要啥gto呢。

当然我对gto的理解也比较肤浅吧 我能理解gto是一种用来防守的 比如我和一个不熟悉的对手 刚开始肯定用gto是最优的 然后可以去发现对手不平衡的地方 进行针对性调整去战胜对手 但这同时也意味着自己也偏离了gto  但我不太理解是完全靠gto本身怎么战胜对手
JCreeks11 发表于 2017-2-8 19:40:28 来自手机 | 显示全部楼层
yyy6 发表于 2017-2-8 10:56
那AI不是盈利了吗?为啥说学GTO是不能帮助盈利或者不输钱呢?事实上扑克的GTO和石头剪刀布完全不一样,石 ...

首先,这世上有很多功夫,GTO可算金钟罩。降龙十八掌可能不是GTO,但对很多人也盈利。不一定非要练一门功夫。

谁都知道练成金钟罩铁布衫别人打不过,那么怎么练这套功夫呢?要算清楚GTO,仅仅会算一些简单的河牌模型列几个方程求个导是远远不够的,AI也是通过海量自我学习逼近GTO。那么怎么自我调整逼近GTO呢?

现在有两种调整方法。一种是每次跟对手打完后,反省自己是不是这样打可以增加盈利,下次调整再试。一种是每次打完以后,反省自己是不是这样打可以减少亏损,下次调整再试。

我现在宣称,前一种方法,不会让自己逼进GTO,有可能让自己远离GTO。后一种学习方法,更容易接近GTO。
 楼主| 傻傻的鱼 发表于 2017-2-8 20:11:37 | 显示全部楼层
我把AGENT J和AGENT K的内容捋了一下,  看看是不是这样:
@JCREEKS  @KEYBATTLE

1:通俗地理解,GTO最终还是为了自己EV最大化服务的,但前提是对手是非常聪明能针对我们打法调整的。-------J认为在对手不会调整的情况下无须关注GTO,剥削就是了。K不完全认同,但同时也表示低级别无须过多关注GTO(没说理由,也许是因为低级别对手不懂调整?) 所以这一点来说,两位实际上没有大的分歧。    我倒是有两个疑问希望J能释疑:我打ONLINE微级别,每天要面对几百上千个不同的对手,我不知道对手会不会调整,甚至连对手的ID都记不住,尽管他们中的大多数都不会调整,这种情况下追求GTO仍然没有必要吗?将对手分类为会调整和不会调整两类,来做为是否用GTO的前提,为什么不是打得过和打不过两类,或者其他分类? 这两个本质上其实是同一个问题。


2:两个绝对正确的人打扑克也是互相不能盈利的。-----K不认同:“为什么说两个绝对正确打牌的人是可以有盈利能力的差别。 所谓绝对正确, 我们把他定义为bet size和bluff/value ratio perfectly balanced。” 在看到K的回复之前,我觉得J的说法肯定是正确的,但是K的说法也很精妙啊,原来还可以这么想。我没有能力分辨这两种说法,姑且都觉得对或者都不对。


3:你这个例子我觉得这样定义“绝对正确”不合理。因为可以构造偏离GTO而EV反而比“绝对正确”高的打法。-----J反对这个例子,但是并没有明言反对K对绝对正确的定义,也就是“BET SIZE.......PERFECTLY BALANCED”     也就是双方对“绝对正确”的定义没有分歧?


4:Y总“如果人真能用完全的GTO,在任何级别都能盈利,这个跟对手会不会调整没有关系。”  正是因为这样我才想学GTO,只不过小鱼儿不敢说这句话。


根据以上内容,J和K关于GTO的主要分歧在于使用GTO帮助牌手赚钱的效率有多快多大,J偏保守一些。这是我个人的理解,不知道对不对。  
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-3-29 18:49 , Processed in 0.044893 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部