智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 4328|回复: 11
打印 上一主题 下一主题

能不能把一手牌写成Markov decision process的形式?

[复制链接]
跳转到指定楼层
1#
benny_xmy 发表于 2017-5-12 04:47:42 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
如图:


分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏
2#
snowsnow 发表于 2017-5-12 21:06:47 | 只看该作者
本帖最后由 snowsnow 于 2017-5-12 21:09 编辑

LZ NB, 你可以写篇论文发表。
图是用啥做的?
理科的论文排版都比文科NB多了。
3#
 楼主| benny_xmy 发表于 2017-5-12 22:14:44 | 只看该作者
snowsnow 发表于 2017-5-12 21:06
LZ NB, 你可以写篇论文发表。
图是用啥做的?
理科的论文排版都比文科NB多了。

LaTex
4#
keybattle 发表于 2017-5-12 22:33:08 | 只看该作者
这些东西,对打牌来说,都是然并卵

turn based stochastic game is based on perfect information, while poker is not.
把简单的东西搞复杂,就是缘木求鱼
5#
 楼主| benny_xmy 发表于 2017-5-12 22:47:56 | 只看该作者
本帖最后由 benny_xmy 于 2017-5-12 23:04 编辑
keybattle 发表于 2017-5-12 22:33
这些东西,对打牌来说,都是然并卵

turn based stochastic game is based on perfect information, while  ...

原ppt确实以deterministic来引入的概念,明牌我猜确实应该比暗牌简单多了,但目前还没看到有人解决了打明牌的问题呀;我觉这个应该不是把简单问题搞复杂,而是把复杂问题搞简单了

我觉MDP可以描绘对所有option的组成,以及value function(reward)的建立;MDP要求每个state都是independent的,这也符合每一手牌的随机性

举个例子,我想说的是,比如这手river我2x pot Allin了对手,有6个价值组合4个空气组合Allin,40%,是1st state;在下一手同样的river我只能1x pot对手,有6个价值组合和3个空气组合,33%,是2rd state;直到一个收敛的稳定infinite state。
6#
Jimihandrix 发表于 2017-5-12 23:36:14 | 只看该作者
本帖最后由 Jimihandrix 于 2017-5-12 23:37 编辑
keybattle 发表于 2017-5-12 22:33
这些东西,对打牌来说,都是然并卵

turn based stochastic game is based on perfect information, while  ...

是的
7#
 楼主| benny_xmy 发表于 2017-5-13 00:14:21 | 只看该作者

兄弟,不瞒你说,这个想法还是受你在回复时候的启发:
不完全信息的博弈游戏,只有将全部游戏做为一个整体分析,才能得到一个相对准确的结果。
所谓将德州做为一个整体分析,直观的说就是将所有街所有策略的所有结果做成一个矩阵,比较所有结果找出最优解。
楼主的方法基于孤立地分析每条街,然后比较四条街之和的最优解,个人认为这种方法得不到的准确的结果。
而我觉MDP确实是可以描绘出“所有街所有策略的所有结果”
8#
doglas 发表于 2017-5-14 01:16:58 | 只看该作者
膜拜,小学文化飘过,
9#
Jimihandrix 发表于 2017-5-14 04:05:58 | 只看该作者
benny_xmy 发表于 2017-5-13 00:14
兄弟,不瞒你说,这个想法还是受你在回复时候的启发:
而我觉MDP确实是可以描绘出“所有街所有策略的所有 ...

计算能力跟不上。
10#
 楼主| benny_xmy 发表于 2017-5-14 06:41:16 来自手机 | 只看该作者
Jimihandrix 发表于 2017-5-14 04:05
计算能力跟不上。

有兴趣的话看一下MDP吧,我猜能行
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-4-27 22:24 , Processed in 0.045206 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部