智游城

标题: 二人Pot Limit Poker的优化策略(更新至2) [打印本页]

作者: Howard    时间: 2010-12-18 00:23
标题: 二人Pot Limit Poker的优化策略(更新至2)
本帖最后由 Howard 于 2010-12-29 06:56 编辑

学习墙,先发在这里占个地方,等鼓捣出东西来再写。本文将会基于大量阅读他人学术论文。

--------------以下是楼主的内容贴--------------------
11楼
19楼
作者: bedok    时间: 2010-12-18 09:38
高人,研究的东西都和别人不一样
在别人研究100米和马拉松的时候,他研究了110米栏
作者: wang139202    时间: 2010-12-18 11:24
靠,刚才进来看了看,忘记回复了,结果沙发没坐上,只能板凳了
作者: ydx2008    时间: 2010-12-18 11:47
这年头似乎人人都会占茅坑了,呵呵。
作者: hahuhu    时间: 2010-12-18 16:21
希望看到霍华德有关《“二人转”与德州扑克的关系》的精彩论文。期待中。。。。。。
作者: 不会打比赛    时间: 2010-12-18 20:56
实话实说,没看懂楼主标题的意思。不知道要讨论啥。火花能解释下吗??
作者: Howard    时间: 2010-12-21 02:46
实话实说,没看懂楼主标题的意思。不知道要讨论啥。火花能解释下吗??
不会打比赛 发表于 2010-12-18 20:56



    还是一个简单模型,两个人HU,发好牌后(或者每人给一个0-1的数),每次bet或raise都是必须是pot-limit,raise次数不限制。没有公共牌。本文试图给出这个模型下的优化(optimal)策略。
作者: Howard    时间: 2010-12-21 02:47
但是今天上班较忙,只能趁午餐时间来城里看看,发帖子要等到明天或者再以后了
作者: 伟大的墙    时间: 2010-12-21 08:25
回复 1# Howard


    这可不是为了卖关子
而是提醒自己
许多时候,想出一个好思路,过两天就忘了。放这里提醒着,能知道自己过几天该写什么。
真是把论坛当家了。
作者: lydhh    时间: 2010-12-21 22:03
期待楼主的作品。。。
作者: Howard    时间: 2010-12-24 06:12
本帖最后由 Howard 于 2010-12-24 06:23 编辑

先复习一下前面提过的东东。

我在《扑克的本质笔记》中提到一个例子:
http://zhiyoucheng.com/viewthrea ... p;extra=&page=7) 第65楼

甲和乙对赌,每人先投入1块钱进底锅,初始底锅为2. 然后每人发一张牌,他们的牌是在(0,1)这个开区间任意取的一个随机数,比方说0.251,0.169004等等。由于区间是连续的,他们两人的牌相等的概率为0。然后甲先决定,他如果check,乙就只能跟着check(不能raise)比大小,牌大者赢;如果甲bet,他必须下注potsize也就是2,此时乙可以选择call或者fold。

如果两人都打优化策略,他们会这样打:甲拿到大于7/9的数会下注(value),拿到小于1/9的数也会下注(bluff),任何中间的数都check;乙拿到大于5/9的数会call,小于5/9则fold。

注意两点:
1. 甲的Value跟Bluff的范围之比是2:1,
2. 乙的跟注点夹在甲value和bluff的中间(未必正中间)

现在扩展一下,让乙也有bet的权利。也就是说,当甲check的时候,乙也可以bet,bet大小还是potsize。甲bet的时候,乙则不可以reraise,还是只能call/fold;甲也不能check-raise。

甲有三个选择:它可以bet,check-fold,或是check-call。他把他所有的牌(0,1)分为四部分,最小的牌,(0,a),他bet进行bluff;稍微好一点的牌(a,b),他check-fold;再好一点的牌(b,c),他check-call;最强的牌(c,1),他bet。而且0<a<b<c<1。

再看看玩家乙。如果甲bet,乙有两个选择call或者fold。研究表明这时乙可以找到一个值d,他的牌在(0,d)的时候就fold,在(d,1)的时候就call。如果甲check呢,乙也有两个选择,check或者bet。注意这时乙的bet既可以是value bet也可以是bluff,所以我们有两个值e和f,当乙的牌在(0,e)的时候就bluff bet,(e,f)的时候就check,(f,1)的时候就value bet。这里的0<e<f<1

甲乙的优化策略如下图所示:

[attach]1117[/attach]

计算过程就按下不表了。a=1/12,b=1/2,c=5/6,d=1/2,e=1/6,f=2/3。

解释一下这些数字:甲bet他1/4的牌而check剩余的3/4;当他bet的时候有1/3是在bluff;当甲bet的时候乙call一半fold一半;当甲check的时候乙check一半bet一半。
作者: 不玩百家乐    时间: 2010-12-24 08:19
不是一般的复杂呀。
作者: bedok    时间: 2010-12-24 10:31
赞!!!
作者: darkillermax    时间: 2010-12-24 11:40
这个帖子得养肥了看,喜欢看技术帖。。。但是更关注最后的结论
作者: 春哥2XX8    时间: 2010-12-24 12:24
Good Idea.
终于有理论家将目光投向了  奥马哈。
坐位看 霍华德讲故事。
作者: Howard    时间: 2010-12-24 13:23
这个帖子得养肥了看,喜欢看技术帖。。。但是更关注最后的结论
darkillermax 发表于 2010-12-24 11:40



结论可能对打扑克没啥指导意义,就是好玩,呵呵,您别失望。
作者: ydx2008    时间: 2010-12-27 15:15
高手一定有自己的东西的,要是有好的理论并能充分运用到实战上去,那就是财源滚滚了,首先当然是有理论先。
作者: xlumulx    时间: 2010-12-28 23:13
真不是一般的没有用。
作者: Howard    时间: 2010-12-29 06:53
本帖最后由 Howard 于 2010-12-29 06:57 编辑

更新之二:

上篇中提到一点:
1. 甲的Value跟Bluff的范围之比是2:1,

为什么是2:1呢?因为pot-limit游戏中,你下注后,对方得到的pot odds永远是2:1,所以你要让他2/3的时间面对你的好牌,1/3的时间面对你的bluff,这样才是一个优化的,optimal,unexploited的策略。

推广一下,假设双方都可以无限次的raise, 牢记2:1的概念。经过计算得到,甲的下注和加注之间的几个关键点是
0.874, 0.973, 0.994, 0.999  。。。。。。
而甲面对对手的raise,他的call与fold之间的关键点分别是: 0.940, 0.987, 0.997, 0.999 .。。。。。

举例说明,甲的牌是0.98,介于两个关键点0.973和0.987之间。他的优化策略是主动下注,并且当对方加注的时候跟注。

现在向扑克的方向靠拢。假设双方不是各拿到一个0-1的数,而是拿到一手扑克牌(五张),用这手牌进行下注。牌是从52张的一副牌中发的。每人有C(52,5)=2,598,960 种组合

很容易想到,扑克牌虽是离散的,但是可以把这离散的牌“映射”到区间【0,1】,按照这个下注就可以了。这个思路是基本可行的。说“基本”,而不是“完全”,主要是因为两点:

1. 很多牌的牌力完全相同,比如仅仅是花色不同的两手牌。
2. 因为只有1副牌,一手牌可能跟其他的牌“相克”,造成排序不定。比如5432A的同花顺,对手可能有31种更高的同花顺,或者3种相等的同花顺;而AAAA6,尽管牌力的排序不如前面的5432A同花顺,却只有27个其他同花顺可以打败它。

好在这两点无伤大雅。仍然按照2,598,960 种组合总排序,牌应该这样打:
[attach]1146[/attach]




欢迎光临 智游城 (http://www.zhiyoucheng.co/) Powered by Discuz! X3.2