智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: RichZhu
打印 上一主题 下一主题

有人有兴趣聊聊AlphaGo、机器学习、以及它对扑克的影响吗?

[复制链接]
11#
谦虚的豆豆 发表于 2016-2-1 23:44:39 | 只看该作者
本帖最后由 谦虚的豆豆 于 2016-2-1 23:48 编辑

机器人真强大
12#
lililili11 发表于 2016-2-2 06:17:18 来自手机 | 只看该作者
notch 发表于 2016-2-1 15:14
机器人破坏的是网络扑克的环境,这个是挖根的行为。
如果扑克室这么干又被揭发(或怀疑)的话,那是自掘 ...

我觉得你说的有道理。事情应该不会变得那么糟糕。机器人的出现对于玩家想要靠扑克赚钱的热情,打击太大了。所以扑克室也不乐意看到可以打败玩家的机器人的出现。还是维持一个"每个人都可以靠扑克发财"的集体幻觉,对扑克室最有利。无法击败的机器人的出现,会惊醒所有人。扑克的这种能赚钱的诱惑力可能比本身的内在乐趣更强,每个人都倾向于认为其他人是鱼,所以才会投入到扑克中,类似博傻游戏。如果大家都理智的话,即使没有机器人,扑克恐怕也只能剩下类似围棋和象棋的热度了。
13#
notch 发表于 2016-2-2 11:40:52 | 只看该作者
ticoarm 发表于 2016-2-1 04:27
最近这几天也在关注这个事情, 对于机器学习, 我上研究生的时候也上过这门课, 感兴趣的朋友可以去网上看scik ...

扑克的确是不完全信息游戏,但这点对人和AI都是一样的
而AI的强大在于大数据的处理,它能记住和分析和对手的所有历史牌局。
如果AI能够从中精准的提炼出每一个人的习惯,那将会是战无不胜的

人类牌手能做的就是用尽可能的平衡防御,但这点受限于人类的各种局限,不可能是完美的防御。
所以我对扑克沦陷持悲观态度
14#
 楼主| RichZhu 发表于 2016-2-3 07:34:39 | 只看该作者
ticoarm 发表于 2016-2-1 04:27
最近这几天也在关注这个事情, 对于机器学习, 我上研究生的时候也上过这门课, 感兴趣的朋友可以去网上看scik ...

原来是来自湾区的朋友,祝早日灭掉bay101的那些妖精,哈。

我认同你的说法,就是扑克机器放弃完全的GTO策略。我一直认为,完全的GTO策略大概会是各种智能扑克软件里面最没前途的一种。

但我不同意你说的,5年之内,无限德州机器人不会击败一流扑克选手。我在微博上说,如果google来做扑克机器人,半年就足以打败人类。
(新浪微博抽风,居然删除了我的那两个关于alphago的微博,越来越不明白国内这些大网站的任性做法了。)

我认为alphago这次引入的“策略网络”和“价值网络”对有效降低机器的蛮力计算,在扑克机器上应用比在围棋机器上的效果会更为显著,这对深筹码无限德州的帮助实在是太大了。

对于人类改变策略来说,我想是不需要太担心的。虽然扑克AI直接走GTO算法行不通,机器的高效自学会让决策非常接近GTO。这应该算是一个比较有趣的地方吧,我们按GTO的算法求解,得不出GTO的答案;让机器自学,完全没有跟机器设定任何GTO关联,最后却能得到非常接近以至于实战上感觉不到差别的GTO应用。

自然在这样的基础上,AI可以有进一步的模式识别来最大化利用具体人类牌手的倾向和漏洞。即便不走到这一步,单单是非常接近GTO,也足以战胜人类牌手了。

一家之言,欢迎拍砖,俺扛得住
15#
 楼主| RichZhu 发表于 2016-2-3 07:48:17 | 只看该作者
lililili11 发表于 2016-2-2 06:17
我觉得你说的有道理。事情应该不会变得那么糟糕。机器人的出现对于玩家想要靠扑克赚钱的热情,打击太大了 ...

即便牌室不考虑机器人对业界的长期伤害,也要考虑作弊的风险与成本。

当初UB/AP出现超级用户,对这些牌室伤害很大,但牌室还是可以以不知道,属于员工个人行为为由,勉强过关。如果是牌室机器人被发现,法律这一关就过不去了。为了维持这个秘密,牌室需要的成本太高了。

另外很多牌室都属于一个更大的游戏公司,牌室收入常常占母公司很小的比例,而且成下滑趋势,母公司也不会允许自己的牌室为了蝇头小利牵连整个公司。

连PS/FTP的母公司都在把重心往那些更赚钱的项目上移,BJ/DFS/...,就不用说其他家了。
16#
泥中土 发表于 2016-2-3 09:31:39 来自手机 | 只看该作者
原来rich老大上一次发贴批评的是靠蛮力的完全gto而非其它粗糙模拟的近似gto呀。
17#
 楼主| RichZhu 发表于 2016-2-4 01:27:36 | 只看该作者
泥中土 发表于 2016-2-3 09:31
原来rich老大上一次发贴批评的是靠蛮力的完全gto而非其它粗糙模拟的近似gto呀。 ...

这两种GTO的实现都不适合人类牌手。另外把第二种说成粗糙模拟并不妥,它只是机器自学在一定条件下的收敛结果,构成的一个平衡或者自洽的体系,是可以做到“足够”逼近正解的。

我上次发帖也不是单指蛮力gto的不可实现,更多的是对中文扑克界在GTO理解和应用方面普遍存在的混乱和误导谈一下我的看法,希望至少对部分玩家多少有些帮助,少走些弯路。这个话题太长,有兴趣的朋友可以看http://www.zhiyoucheng.co/thread-23321-1-1.html

从人类的角度来讲,扑克真的是一个很朴实的东西。不管AI进化到什么程度,人类最有效最实用的学习途径还是要从基础知识、基本概念开始,而整个过程最重要的部分一定是让自己学会用脑,而不是带着幻觉钻牛角尖。

18#
 楼主| RichZhu 发表于 2016-2-4 01:46:44 | 只看该作者
notch 发表于 2016-2-2 11:40
扑克的确是不完全信息游戏,但这点对人和AI都是一样的
而AI的强大在于大数据的处理,它能记住和分析和对 ...

扑克沦陷给AI没关系哈,反正扑克是人跟人的对局。

国际象棋沦陷快20年了,人类仍然兴致勃勃地玩,高手仍然是智力比较好的那个群体。我觉得扑克机器战胜人类对扑克整体水平的影响要远小于国象和围棋的影响。
19#
ticoarm 发表于 2016-2-5 16:05:53 | 只看该作者
RichZhu 发表于 2016-2-3 07:34
原来是来自湾区的朋友,祝早日灭掉bay101的那些妖精,哈。

我认同你的说法,就是扑克机器放弃完全的GTO ...

先感谢一下老大的祝福, 我一定好好学牌, 我想我一定会在bay101打出成绩.
对于何时机器人能够击败一流选手, 我重新认真思考了一下, 觉得这个问题量化处理的话, 其实就是CPU时间和算法问题.

我知道老大对于围棋有研究, 对于AlphaGo所表现出来的能力与解决围棋游戏所需要的CPU时间和算法之间的关系一定有更深刻的理解, 从解决围棋问题来看, 上述的CPU时间和算法这两个要求, Google公司一定是足够的, 所以我现在觉得自己之前说的5年内机器人无法击败人类有些欠妥, 其实我之前得出这个结论也是由于我对于GTO的误解, 但这里就不详细说了.

总之, 很喜欢也很感谢这样的讨论, 希望以后继续, 共同进步, 也给大家拜个早年.
20#
amandag 发表于 2016-2-5 21:49:17 来自手机 | 只看该作者
个人有编程的能力,最近在思考一些牌例的时候想用编程来模拟和对手交手的各种action,结果发现自己很多牌原来想的并不清楚。比如100bb有效筹码,我们mp所有open的range被后位call(我们可以根据对手的入池率来估算对手的calling range),我们在什么样的flop会cbet,如果对手call,所有可能的range是什么,turn上我们继续bet对手raise的range可能是什么?我们需要马上弃牌吗?具体点,mp 99 open 之后能cbet的flop有多少个,那些flop适合check call,什么样的情况在turn上必须放弃。我们现在总是用经验去解决问题,但互联网大数据的时代,数据分析肯定更有价值.
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-4-28 04:50 , Processed in 0.046152 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部