智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: RichZhu
打印 上一主题 下一主题

有人有兴趣聊聊AlphaGo、机器学习、以及它对扑克的影响吗?

[复制链接]
61#
 楼主| RichZhu 发表于 2016-3-23 02:37:21 | 只看该作者
Rich 00:32
我估计那些职业棋手最郁闷的是,不知道什么地方阿狗开始领先的。这盘棋前面一直在说阿狗这地方亏了,那地方亏了,没有赚的地方,然后就判断阿狗领先了

qian tao 00:33
李世石怒砸阿尔法狗,结果发现阿尔法狗机箱里藏着柯洁。。。

Rich 00:52
我最佩服的是新浪解说,严重怀疑李世石跟谷歌有秘密协议,不得打劫,而且严正指出阿狗中腹提劫绝对先手却一直错过,完全不会打劫

Rich 00:54
新浪小编肯定以为谷歌跟百度做事一个风格

Kunlun 00:55
新浪很多脑残编辑。其它新闻也是

萤火虫虫 00:56
内行也看外行热闹[Chuckle]

Rich 00:59
新浪编辑后半盘的评论核心已经不是棋了,而是阿狗不会打劫,还说孔杰等职业棋手也在聊这个话题

Kunlun 01:00
嗯 看到了。还说阿狗不会打劫已经可以确定。人类不能打劫相当于自缚一臂

Rich 01:02
其实很好解释,阿狗领先后寻找简单着法而不是最佳着法,它只关心安全运作,没事打什么劫?

阳 01:03
估计它的评估系统里面有复杂度的分数

阳 01:04
不打劫 下面10步内的所有path看 平均胜率是越来越高 趋近于100%

阳 01:05
而打劫可能这一步胜率99%但十步后平均还是99%

阳 01:05
复杂度太高

Rich 01:06
昨天说李世石优势后放松输棋的今天会说什么?左下之后所有职业选手都说小李大优,柯洁说他下肯定赢。后来怎么输的,好像没谁说怎么就逆转了。

Rich 01:07
打劫肯定增加搜索的宽度和深度

萤火虫虫 01:07
编辑犯的是常识性错误还是专业性错误?是一般专业性还是非常专业性错误。如果前者,属于忽悠,如果后者,属于不懂装懂。[Chuckle]

萤火虫虫 01:07
我想编辑不可能太专业

Rich 01:09
编辑犯的是最简单的常识错误,就是谷歌不可能通过改变游戏规则来取胜,这是很无耻的行为,也就只有百度这样的公司才会触及这个起码底线,对吧?

萤火虫虫 01:09


Rich 01:11
关键是那些职业棋手也跟着起哄,比输给机器本身还丢人

Rich 01:17
其实第一盘李世石角部开过劫,阿狗自己没打劫。不跟你打劫让着你还赢你,这还不牛?

萤火虫虫 01:19
只能说,阿狗啊,他们真不懂你

Rich 01:21
这盘棋对李世石的心理打击肯定很大,弄不好他的职业生涯会缩短很多

萤火虫虫 01:26
我是不懂,但感觉这里面跟德扑的一些strategy 也挺像的

萤火虫虫 01:31
我喜欢看军事的东西,觉得跟德扑有时能扯上。象围棋这种中国的东西,黑白二子,一阴一阳,变化无穷,是不跟中国道家如鬼谷子之类扯上关系
62#
 楼主| RichZhu 发表于 2016-3-23 02:46:01 | 只看该作者
Rich 01:35
棋牌多少是相通的

Rich 01:37
不过这次职业棋手也都承认阿狗的大局观和对棋的理解都不逊于人类顶尖棋手

Rich 01:38
估计柯洁也不用整天暴走,疾呼李世石运气好,白捡100万美元了

周力 01:40
哈哈

周力 02:08
一开始我以为樊麾把机器骗了,原来机器把打家都骗不

Rich 07:52
[柯洁古力谈第二局观感 是否有不打劫协议扑朔迷离: http://mp.weixin.qq.com/s?__biz= ... 5LCY7c9rGjdjoGI2#rd]

Rich 07:52
[李世石:没有机会领先 不清楚为什么要问有无协议: http://mp.weixin.qq.com/s?__biz= ... CiCDUoCCho9juZqN#rd]

Rich 07:57
这么多顶级棋手怀疑并敢公开说出来,真的是太丢人了,更可怕的是这个居然有市场。

周力 08:50
[Voice]

Rich 08:57
肯定没有啊。谷歌不可能做这种事,属于欺诈行为。这种质疑也就大陆棋手想得出来,生活在一个没有诚信和起码契约精神的社会才会有这种变态的思维,而且是一种很自然的流露。

豆豉鲮鱼 08:57
同意

豆豉鲮鱼 08:58
自然流露太悲哀

Rich 09:03
在欧美你这样质疑,人家会觉得你在开玩笑,在日韩会觉得好笑,在国内这就是智慧了。像柯洁老聂这些言论,人类跟机器这次对决,中国棋界的表现绝对差评。

汤振 14:43
阴谋论在哪都很有市场,不独在中国。

Rich 15:12
也看是关于什么吧?这种怀疑谷歌暗箱操作修改规则来赢得一场比赛,不但把谷歌想得太低,也是对参赛选手的侮辱。这不就是合伙作弊,各取所需吗?

63#
 楼主| RichZhu 发表于 2016-3-23 02:51:19 | 只看该作者
我发现节选也是一个体力活,尤其是论坛程序不认得一些图标,会把筛选出的一大段发成一小段,就到这吧。
64#
 楼主| RichZhu 发表于 2016-3-23 03:04:45 | 只看该作者
gaosi 发表于 2016-3-11 20:39
我个人觉得现在机器人唯一能领先人类的就是大型MTT比赛ICM的精准计算 但是MTT的波动就把它盖住了
在cash里 ...

大型mtt比赛icm精准计算并不需要AI,只是一个计算量很大的简单计算。(怎么听起来有点别扭?)

另外,大型mtt比赛icm精准计算也没有多少实用价值,因为icm本身就是一个粗糙的模型,过度量化是没有意义的。
65#
gaosi 发表于 2016-3-24 22:03:42 | 只看该作者
RichZhu 发表于 2016-3-23 03:04
大型mtt比赛icm精准计算并不需要AI,只是一个计算量很大的简单计算。(怎么听起来有点别扭?)[/backcolo ...

感谢大神回复
我想表达的就是机器最早最原始的功能
快速精准但是“笨”

其实很有意思的就是人类从未因为机器算数被人快 机器重复劳动错误率比人小而惊恐过
事实上这就是人类发明机器的本意

个人感觉机器在ICM精细化问题上价值不大的主要原因还是德州的牌型还是太少了一些
比如我们机器会算出来根据ICM 某一手牌allin在ICM支持需要的牌力是52.90%(举例)
人类会说 Q7o就fold  Q8o就call
也许量化出来 Q7o是49% Q8o是54% 不存在49%-54%之间的牌型 所以人类做决策并不难 机器没有优势
当然 从这个计算带来的$ev偏差 在MTT的超大波动面前九牛一毛

唉 说到最后我都不知道要说什么了

66#
 楼主| RichZhu 发表于 2016-3-25 02:24:43 | 只看该作者
gaosi 发表于 2016-3-24 22:03
感谢大神回复
我想表达的就是机器最早最原始的功能
快速精准但是“笨”

精准计算是不能弥补模型本身缺陷的。

举个例子,wsop主赛接近钱圈,前注和盲注为1k/4k/8k,还剩700人,695的钱圈,你有6k,这时候你拿到AK,怎么办?

人类牌手的第一反应就是:你在什么位置?下一句话就是:通常还需要几手进钱圈?然后可能还会问:你后面的牌手松还是紧?

凭经验,差不多需要4,5手牌的样子进钱圈,这样如果你是在btn的位置就应该扔掉了,不难看出,这里allin,chip ev是正的,但money ev是负的。如果你在utg的位置就该allin了,因为你在下面两手中的一手不得不allin,而你的牌很可能不及AK,何况你赢了的筹码也是越靠后面allin越少,这里AK allin应该是cEV和mEV都是正的。

使用icm怎样帮助你做决策?你首先要计算你这6k筹码的mEV吧?可是我们都知道同样的6k筹码,此时在枪口和在按钮的价值是有明显区别的,但在icm中却是同样的价值,这肯定是误差了,后面计算的再精准也就没有多大意义了。

67#
gaosi 发表于 2016-3-26 22:32:18 | 只看该作者
RichZhu 发表于 2016-3-25 02:24
精准计算是不能弥补模型本身缺陷的。

举个例子,wsop主赛接近钱圈,前注和盲注为1k/4k/8k,还剩700人,6 ...

感谢回复

忘记了哪个教材里看的了
该文章的作者承认在1BB以下的时候ICM有极大计算误差
此外在筹码量1BB以上但是比较小的时候 敏感位置(尤其是UTG) ICM的计算也会发生和真正+$ev相悖的结论

不过这么说才是阿法狗的意义

虽然我对计算机了解的不多 真的很少很少

但是计算机的一切都源自于背后的人类给他做的数学建模

计算机的优势是快速计算以及重复工作无误差(后边这个用在工业上)

劣势是人类的主观能力为0

所以人类的工作就是帮计算机做好最完美的建模 提前处理掉计算机在work过程中一切会遇到的 需要人主观能力解决的障碍

或者回避他 或者想办法用数学的办法转化他(比较典型的就是识图功能)

人类从未因计算机下中国象棋比人强而恐慌 但是车=9分 马=4.5分这种东西 人类不提前设计好 机器懂个P

围棋难度在于计算量过大 超越目前计算机计算能力 导致“只能用人类主观方式”下棋

而deepmind 就是把这种主观 转化成了客观的计算

最大的贡献 还是前期算法设计上



68#
gaosi 发表于 2016-3-26 22:41:51 | 只看该作者
RichZhu 发表于 2016-3-25 02:24
精准计算是不能弥补模型本身缺陷的。

举个例子,wsop主赛接近钱圈,前注和盲注为1k/4k/8k,还剩700人,6 ...

ICM目前的模型只能计算静态的部分
包括手牌开始ICM价值以及你这手牌打完的(比如你和某人allin了之后)ICM价值

其实只要有条件 愿意做研究 包括枪口位置的动态ICM还是可以做出来的

也就是说 这手牌我allin ICM会如何 如果我fold了 下一手牌我是大盲 先要被迫除掉我多少筹码 下一手牌的牌力是50%……

这样一直推算下去 只要建模工作做得好 公式都给计算机罗列出来 算这些计算机就是一秒钟的事

只是可能还是我一开始说的 真的会让你fold和push两难的牌其实并不多

再说真的在这种时候抓到这样两难的牌 fold和allin的ev也差不了多少——和MTT的超高波动比

69#
royalflush 发表于 2016-3-26 23:43:03 | 只看该作者
ICM与 AlphaGo、机器学习完全是两回事,根本没有关系到
ICM本身只是一个数学模式,这个模式是没有位置和盲注的因素的,所以有一定的局限和限制。

《扑士》第55期 (1月18日2016年)http://pushi8.com/jan2016 里边有简单的ICM介绍文章
70#
flyinglion 发表于 2016-3-31 18:10:47 | 只看该作者
古力:“也许吹牛,如果职业电竞选手和我互换各练十年,围棋我只能呵呵,电玩我一定会给他们压力!”

翻译:“玩围棋的最牛B,所以我牛B,玩其他的都是傻B。”

点评:该牛吹得和和要当共产主义接班人是一个级别的。

影响:艾娃除不能在中国当职业球员外,还不能当职业棋手了(目前仅限围棋)~
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-4-30 00:30 , Processed in 0.044002 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部