智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: Howard
打印 上一主题 下一主题

二人Pot Limit Poker的优化策略(更新至2)

  [复制链接]
11#
 楼主| Howard 发表于 2010-12-24 06:12:26 | 只看该作者
本帖最后由 Howard 于 2010-12-24 06:23 编辑

先复习一下前面提过的东东。

我在《扑克的本质笔记》中提到一个例子:
http://zhiyoucheng.com/viewthrea ... p;extra=&page=7) 第65楼

甲和乙对赌,每人先投入1块钱进底锅,初始底锅为2. 然后每人发一张牌,他们的牌是在(0,1)这个开区间任意取的一个随机数,比方说0.251,0.169004等等。由于区间是连续的,他们两人的牌相等的概率为0。然后甲先决定,他如果check,乙就只能跟着check(不能raise)比大小,牌大者赢;如果甲bet,他必须下注potsize也就是2,此时乙可以选择call或者fold。

如果两人都打优化策略,他们会这样打:甲拿到大于7/9的数会下注(value),拿到小于1/9的数也会下注(bluff),任何中间的数都check;乙拿到大于5/9的数会call,小于5/9则fold。

注意两点:
1. 甲的Value跟Bluff的范围之比是2:1,
2. 乙的跟注点夹在甲value和bluff的中间(未必正中间)

现在扩展一下,让乙也有bet的权利。也就是说,当甲check的时候,乙也可以bet,bet大小还是potsize。甲bet的时候,乙则不可以reraise,还是只能call/fold;甲也不能check-raise。

甲有三个选择:它可以bet,check-fold,或是check-call。他把他所有的牌(0,1)分为四部分,最小的牌,(0,a),他bet进行bluff;稍微好一点的牌(a,b),他check-fold;再好一点的牌(b,c),他check-call;最强的牌(c,1),他bet。而且0<a<b<c<1。

再看看玩家乙。如果甲bet,乙有两个选择call或者fold。研究表明这时乙可以找到一个值d,他的牌在(0,d)的时候就fold,在(d,1)的时候就call。如果甲check呢,乙也有两个选择,check或者bet。注意这时乙的bet既可以是value bet也可以是bluff,所以我们有两个值e和f,当乙的牌在(0,e)的时候就bluff bet,(e,f)的时候就check,(f,1)的时候就value bet。这里的0<e<f<1

甲乙的优化策略如下图所示:



计算过程就按下不表了。a=1/12,b=1/2,c=5/6,d=1/2,e=1/6,f=2/3。

解释一下这些数字:甲bet他1/4的牌而check剩余的3/4;当他bet的时候有1/3是在bluff;当甲bet的时候乙call一半fold一半;当甲check的时候乙check一半bet一半。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
12#
不玩百家乐 发表于 2010-12-24 08:19:26 | 只看该作者
不是一般的复杂呀。
13#
bedok 发表于 2010-12-24 10:31:32 | 只看该作者
赞!!!
14#
darkillermax 发表于 2010-12-24 11:40:29 | 只看该作者
这个帖子得养肥了看,喜欢看技术帖。。。但是更关注最后的结论
15#
春哥2XX8 发表于 2010-12-24 12:24:35 | 只看该作者
Good Idea.
终于有理论家将目光投向了  奥马哈。
坐位看 霍华德讲故事。
16#
 楼主| Howard 发表于 2010-12-24 13:23:43 | 只看该作者
这个帖子得养肥了看,喜欢看技术帖。。。但是更关注最后的结论
darkillermax 发表于 2010-12-24 11:40



结论可能对打扑克没啥指导意义,就是好玩,呵呵,您别失望。
17#
ydx2008 发表于 2010-12-27 15:15:29 | 只看该作者
高手一定有自己的东西的,要是有好的理论并能充分运用到实战上去,那就是财源滚滚了,首先当然是有理论先。
18#
xlumulx 发表于 2010-12-28 23:13:50 | 只看该作者
真不是一般的没有用。
19#
 楼主| Howard 发表于 2010-12-29 06:53:29 | 只看该作者
本帖最后由 Howard 于 2010-12-29 06:57 编辑

更新之二:

上篇中提到一点:
1. 甲的Value跟Bluff的范围之比是2:1,

为什么是2:1呢?因为pot-limit游戏中,你下注后,对方得到的pot odds永远是2:1,所以你要让他2/3的时间面对你的好牌,1/3的时间面对你的bluff,这样才是一个优化的,optimal,unexploited的策略。

推广一下,假设双方都可以无限次的raise, 牢记2:1的概念。经过计算得到,甲的下注和加注之间的几个关键点是
0.874, 0.973, 0.994, 0.999  。。。。。。
而甲面对对手的raise,他的call与fold之间的关键点分别是: 0.940, 0.987, 0.997, 0.999 .。。。。。

举例说明,甲的牌是0.98,介于两个关键点0.973和0.987之间。他的优化策略是主动下注,并且当对方加注的时候跟注。

现在向扑克的方向靠拢。假设双方不是各拿到一个0-1的数,而是拿到一手扑克牌(五张),用这手牌进行下注。牌是从52张的一副牌中发的。每人有C(52,5)=2,598,960 种组合

很容易想到,扑克牌虽是离散的,但是可以把这离散的牌“映射”到区间【0,1】,按照这个下注就可以了。这个思路是基本可行的。说“基本”,而不是“完全”,主要是因为两点:

1. 很多牌的牌力完全相同,比如仅仅是花色不同的两手牌。
2. 因为只有1副牌,一手牌可能跟其他的牌“相克”,造成排序不定。比如5432A的同花顺,对手可能有31种更高的同花顺,或者3种相等的同花顺;而AAAA6,尽管牌力的排序不如前面的5432A同花顺,却只有27个其他同花顺可以打败它。

好在这两点无伤大雅。仍然按照2,598,960 种组合总排序,牌应该这样打:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-5-5 15:00 , Processed in 0.044566 second(s), 8 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部