有人有兴趣聊聊AlphaGo、机器学习、以及它对扑克的影响吗？

RichZhu · 发表于 2016-2-16 03:40:52

AlphaGo跟李世石的人机大战确定于3月9日、10日、12日、13日和15日在首尔举行，奖金为100万美元。国外的朋友可以在YouTube观看直播。

RichZhu · 发表于 2016-2-18 05:33:20

跟围棋ai相比，扑克ai的研究只能算是连一挺歪把子机枪都没有的区小队。google跟facebook的ai竞赛，岂是这些扛着三八大盖数着还剩几颗子弹的民兵所能比？

RichZhu · 发表于 2016-2-20 06:43:10

sexrange 发表于 2016-2-18 16:43
听过google团队的核心人员表示，之前参与过的项目包括poker和星际争霸。从理论上来说这两个项目属于失败 ...

没有看到这一段，有链接吗？作为AI研究者，接触各类游戏项目是正常的，不过扑克项目对围棋项目的帮助有多少，是个有趣的话题。

传统算法中，机器围棋和机器扑克走的是完全不同的路。围棋是典型的完美信息博弈，采用各种形式的树状搜索；而扑克则是不完全信息博弈的代表，博弈论是它的基石。

人工智能专家一直偏爱围棋AI，研究的力度和投入的资源远非扑克能比。最早的围棋程序出现在上世纪60年代，到了80年代末就已经有不少人关注了。我记得90年前后，好像是应氏围棋基金还是哪个组织就50万美元悬赏计算机程序：击败一个11岁的小孩就可以。91年出现网络围棋，机器围棋也进入一个发展阶段。说来也巧，AlphaGo使用的数据来自KGS，而KGS的前身就是第一家网络围棋IGS。

相比之下，扑克机器的研究时间和规模就差得多了，都是本世纪的事。有代表性的成果也就是阿尔伯塔大学的Polaris和卡内基梅隆大学的Claudico，再加上一个商业性质的snowie。这个跟谷歌公开AlphaGo的前一天，facebook老板扎克伯格在脸书上大谈他自己的AI团队及围棋程序Darkforest形成鲜明的对比。

不过在alphago的混合算法获得突破性成果之后，机器围棋和机器扑克可能殊途同归，想想也是自然的进程。

RichZhu · 发表于 2016-2-20 06:58:31

monox0 发表于 2016-2-19 21:59
对诸位大神的评论表示认同-- 机器超过人只是时间的问题，如果不是已经。
而且这个时间是很短的。

最终的结果，只能依靠法律。

就像你无法用任何技术手段阻止偷窃不发生一样，惩罚性法规和可执行性，才是把偷窃降低到社会可容忍限度内的基本办法。

技术的进步产生了网络扑克，反过来，对网络扑克的根本威胁也来自于技术的进步。靠技术的进步来阻止技术带来的破坏是不现实的/违反逻辑的。

RichZhu · 发表于 2016-2-23 04:53:53

swatow 发表于 2016-2-22 10:08
那桥牌呢？桥牌的赛制多样，还有各种叫牌体系，AI应该就比较困难了吧，即便AI可能坐庄会比较厉害。 ...

桥牌实际上是相对容易的。

尽管现在仍不能宣称机器桥牌击败人类，但十年前桥牌程序就已经到了大师级别。之所以桥牌没有更多的提高从而宣布战胜人类，主要原因应该不是技术上的，而是普遍缺少的学术和商业兴趣，没有像国际象棋或者围棋那样吸引主力部队参战。

按说桥牌本身是带有随机性的不完全信息游戏，跟围棋国象等棋类是完全不同的两类，但实际处理过程中，典型的桥牌程序采用了“双明手”的算法解决核心的搜索部分。就是不但坐庄的一方有一个明手，防守一方也有一个明手，这样就是四家全明牌了。自然在这种情况下，计算大大简化，因为双方都有一个明确的路径达到己方获取最多墩数。

另一方面，我们知道桥牌在叫牌的时候是有很多明确规定的。我记得刚来美国的时候去当地一家俱乐部，打了第一手牌，对方就叫了裁判。我是明手，摊牌的时候，对方质疑我为什么会应叫1d，我回答说，同伴1c是逼叫性开叫，我的1d只是示弱，跟牌型牌点无关。由于事先已经告知对方我们使用精确叫牌体系，觉得这是很基本的内容，根本不用提示对方，但对方不懂这个体系，我们没有提示错误就在我们，因为缺省叫牌体系是自然叫牌法。从程序的角度来说，叫牌体系规定的严格其实是有利于机器的，它可以很有效地收集信息，也可以比人类跟有效地找到对方违规叫牌。

这样，桥牌机器在各种已知信息下寻找最佳打法其实就是根据各种可能的“双明手”样本计算优化策略。当然赛制本身是一个考虑，但目前基本上都是定约桥牌，只是考虑一下队式赛和双人赛等不同算分方式进行相应的调整，这类调整都是完全独立的，对机器不是问题。

说到这里就简单了，桥牌程序没什么特别的人工智能出彩的地方，这大概是为什么它缺少学术兴趣吧？而商业兴趣，可以想象它没法跟德州扑克相比，桥牌这个行业，没什么可以赚钱的地方。

不过桥牌的这种算法是不能应用在无限德州扑克上面的。最大的问题是无限德州扑克不但需要打牌策略，还需要下注策略，这使得扑克机器的样本空间爆炸性地增长，从而使这个算法变得不现实。

需要提醒一下，大家之所以对alphago评价很高，就是它非常有效地降低了算法对机器系统资源的消耗。

最后说一句关联的话，所有国内流行的非wsop项目的扑克游戏，都属于短期内可以做出战胜人类的程序，只是看有没有人愿意做。这些包括斗地主，双扣，大菠萝等等任何你可以想到的扑克游戏。这些游戏易解的原因就是它们因为没有下注策略的要求导致计算量远远小于无限德州扑克。

RichZhu · 发表于 2016-3-22 16:31:19

这次人机大战这么热闹，都惊动了两会，咱们这个主题却冷清了。

这个怪我，头几天没网络，只能手机观看，在微信和QQ上聊聊。后来有了网络，却一直太忙，没时间发帖。现在能发帖了，这个比赛的热乎劲也过去了。

好在对智游城的朋友来说，这个主题并不过时，人机大战的结果会让更多的牌手思考扑克理论和应用的问题。

可是真的要写什么，却发现网络上的相关信息经过一个短暂的爆发，没留下很多可写的了。截取智游城模范居民群的部分聊天做个交代，这个主题也不算烂尾楼了。

至少，在Alphago可能的表现、比赛过程中疯传的打劫问题和秘密协议等热点上，智游城的微群讨论是领先主流媒体和职业棋手的，值得整理出来留在论坛上。当然，处于各种原因，只能整理其中的一部分。

RichZhu · 发表于 2016-3-22 16:56:05

Rich 20:15
比赛开始了

智游门徒 royalflush 20:44
[ThumbsUp] Rich 来现场报道和分析

Rich 21:05
alpgago 的进步让绝大多数关注者感到意外

Rich 21:06
当然不包括顺子和智游城很多有理工科背景的玩家

soho 21:08
到底是程序员编译的程序在对战还是程序自己拥有了AI在对战

Rich 21:10
AG有很强大的自学能力

soho 21:11
这个自学能力是程序员赋予他的，还是他自己进化的

Kunlun 21:11
第一盘是不是基本决定了最终结果？

Rich 21:12
神经网络

Rich 21:13
第一盘基本就知道AG过去五个月的提高程度

Rich 21:16
这盘棋到目前为止李世石一直不占上风，不是好事，如果中盘不占优，就很难赢了

soho 21:16
好高端，把这个机器设计成类似人脑那样，然后不停模拟大量棋局与自己对奕，来提高水平

Kunlun 21:18
中国也搞了个跟科杰下

汤振 21:21
官子计算量应该相对少，机器占优

Mike 23:39
AlphaGo真的赢了

Mike 23:41
让四子吧？

智游门徒 royalflush 23:54
明天还有机会扳平

智游门徒 royalflush 23:54
不要输0-5就好

————— 2016-03-09 —————

Mike 00:04
大概看了一下棋谱，这李世石太不把AlphaGo当人了吧

Bart 00:11
不当人不对吗[Shocked]

Mike 00:14
感觉他要是当成正常人下正常棋赢的面更大，他好像有点针对机器，就像我们在牌桌上过分针对鱼而背离了自己习惯的打法似的

萤火虫虫 00:18
我是文科背景，更不觉得奇怪，文科生一般具有超乎理工生的想象力，另一方面，文科生习惯马后炮。

Rich 00:21
我没有马后炮，昨天还跟人说AG这几个月的进步会让大多数人意外

Rich 00:24
其实这盘棋的质量很高，李世石输不是因为发挥失常

萤火虫虫 00:32
感觉李世石跟机器好像不止差一点

萤火虫虫 01:42
还有四局：周四、六、日、二

soho 01:42
网上有开盘吗，赔率多少

萤火虫虫 01:43
不知道[Chuckle]，肯定有

soho 01:44
上次小李子小金人开1/20，买20赔21

萤火虫虫 01:44
[Grin]

智游门徒 royalflush 03:03
只能说 alphago 非常强大 lee sedol 只要不输 0-5 就ok了

萤火虫虫 03:10
从新闻角度，后面不重要了，一上来就输一场，好戏剧，而且李之前还放话说机器不行，他真的不知道机别三日，当刮目相看吗，他真的一点没做功课吗？我看未必，可能配合作秀呢？从此角度，后面让应该会赢。[Chuckle]

萤火虫虫 03:10
他

萤火虫虫 03:16
回到德扑：

智游门徒 royalflush 03:17
应该没做戏

萤火虫虫 03:19
他对机器人的了解差距不应该那么大

智游门徒 royalflush 03:19
如果你去 alphago page 看那些 paper, 一个paper 用几个月初步了解那里有超过10个paper

智游门徒 royalflush 03:20
Alphago 的公开局只有 5-0 赢 fan hui

智游门徒 royalflush 03:21
只能说 lee sedol 遇上他最强的对手了

zhigang 04:51
李世石靠不住，中盘后优势却在收官时连连失误挥霍，要是柯洁上就没有问题[Grin]

zhigang 04:56
柯洁对李世石8:2遥遥领先

萤火虫虫 05:32
[App message]

Rich 10:56
还是没受过理工训练。他对李世石有优势并不等于是alphago更厉害的对手，后半盘好的棋手对alphago来说更容易

RichZhu · 发表于 2016-3-22 17:43:05

阳 20:04
柯洁说这话根本没逻辑。目前电脑的弱点都没得到确认

阳 20:05
李世石能赢一盘的话他这再说这话还有点可信。还得看怎么赢的。

Mike 20:06
看了一些棋手的分析，基本上李世石的发挥有问题比如说轻敌这一点是共识了。我觉得最后他会取胜的，除非他真的下注买自己输了[Grin]

Mike 20:13
昨天刚结束我也认为是他太不把电脑当人了，如果他把电脑当柯洁赢面会非常大

萤火虫虫 20:20
我一个同学说他下得还是有点随意，我是不懂

Rich 20:30
说李世石轻敌的大概都不了解李世石，不了解韩国棋手

Rich 20:31
韩国人下棋哪怕是修车开餐馆都比咱们中国人敬业得太多

阳 20:32
轻敌不至于，我觉得倒是可能有点紧张，发挥的确不是最好

阳 20:32
但是可能发挥怎样都无所谓的

Kunlun 20:34
我昨天感觉

RichZhu · 发表于 2016-3-23 02:26:04

Rich 20:45
昨天最搞笑的是古力说李世石领先后松懈。没有几个人像古力那样了解自己的老对手了，所以他的话自然有人信。这大概反应职业棋手整体的心理失衡，并不是客观的评语

阳 20:46
柯洁在白棋点了后，摆了10多分钟，结论还是黑棋胜定

Kunlun 20:46
嗯我觉得李喆的文章比较客观文字也很好有条有理

Rich 20:55
哈，今天嘉宾里面有几位大家的朋友

豆豉鲮鱼 20:56
都看围棋TV呀[Chuckle]

赌棍YY 20:57
电脑加油，我压了1500:）

阳 20:57
这盘棋要是昨天下的话估计电脑已经被嘲笑死了

智游门徒 royalflush 20:57
我还是希望人赢啊虽然不像之前那么乐观

阳 21:12
不过有没有一种可能性。google今天反而故意放水

阳 21:12
减少几组CPU[Chuckle]

Mike 21:13
不是说那种普通意义上的轻敌而不认真，而是骨子里没把对手当正常对手看。

俊雄 22:14
李是不是有让子啊？

qian tao 22:17
我怎么感觉上面那一片全是黑子的

蕃薯 22:17
现在是AG让GPU

正午 23:09
又要输？

zhigang 23:10
一边看棋，一边打牌，一把AA赢了七千多的一锅[Joyful]。人类输就输吧[Grin]

George 23:18
全民关注啊

Kunlun 23:48

RichZhu · 发表于 2016-3-23 02:37:21

Rich 00:32
我估计那些职业棋手最郁闷的是，不知道什么地方阿狗开始领先的。这盘棋前面一直在说阿狗这地方亏了，那地方亏了，没有赚的地方，然后就判断阿狗领先了

qian tao 00:33
李世石怒砸阿尔法狗，结果发现阿尔法狗机箱里藏着柯洁。。。

Rich 00:52
我最佩服的是新浪解说，严重怀疑李世石跟谷歌有秘密协议，不得打劫，而且严正指出阿狗中腹提劫绝对先手却一直错过，完全不会打劫

Rich 00:54
新浪小编肯定以为谷歌跟百度做事一个风格

Kunlun 00:55
新浪很多脑残编辑。其它新闻也是

萤火虫虫 00:56
内行也看外行热闹[Chuckle]

Rich 00:59
新浪编辑后半盘的评论核心已经不是棋了，而是阿狗不会打劫，还说孔杰等职业棋手也在聊这个话题

Kunlun 01:00
嗯看到了。还说阿狗不会打劫已经可以确定。人类不能打劫相当于自缚一臂

Rich 01:02
其实很好解释，阿狗领先后寻找简单着法而不是最佳着法，它只关心安全运作，没事打什么劫？

阳 01:03
估计它的评估系统里面有复杂度的分数

阳 01:04
不打劫下面10步内的所有path看平均胜率是越来越高趋近于100%

阳 01:05
而打劫可能这一步胜率99%但十步后平均还是99%

阳 01:05
复杂度太高

Rich 01:06
昨天说李世石优势后放松输棋的今天会说什么？左下之后所有职业选手都说小李大优，柯洁说他下肯定赢。后来怎么输的，好像没谁说怎么就逆转了。

Rich 01:07
打劫肯定增加搜索的宽度和深度

萤火虫虫 01:07
编辑犯的是常识性错误还是专业性错误？是一般专业性还是非常专业性错误。如果前者，属于忽悠，如果后者，属于不懂装懂。[Chuckle]

萤火虫虫 01:07
我想编辑不可能太专业

Rich 01:09
编辑犯的是最简单的常识错误，就是谷歌不可能通过改变游戏规则来取胜，这是很无耻的行为，也就只有百度这样的公司才会触及这个起码底线，对吧？

萤火虫虫 01:09
嗯

Rich 01:11
关键是那些职业棋手也跟着起哄，比输给机器本身还丢人

Rich 01:17
其实第一盘李世石角部开过劫，阿狗自己没打劫。不跟你打劫让着你还赢你，这还不牛？

萤火虫虫 01:19
只能说，阿狗啊，他们真不懂你

Rich 01:21
这盘棋对李世石的心理打击肯定很大，弄不好他的职业生涯会缩短很多

萤火虫虫 01:26
我是不懂，但感觉这里面跟德扑的一些strategy 也挺像的

萤火虫虫 01:31
我喜欢看军事的东西，觉得跟德扑有时能扯上。象围棋这种中国的东西，黑白二子，一阴一阳，变化无穷，是不跟中国道家如鬼谷子之类扯上关系

		自动登录	找回密码
密码			注册

有人有兴趣聊聊AlphaGo、机器学习、以及它对扑克的影响吗？

客服中心

投诉建议