谁能击败AlphaGo?答案是具备自我学习能力的AlphaGo Zero
2017-10-19 14:45:43 | 来源:ithome | 投稿:米阳 | 编辑:dations

原标题:谁能击败AlphaGo?答案是具备自我学习能力的AlphaGo Zero

Alphabet子公司DeepMind周三(10/18)宣布,已打造一个比AlphaGo更厉害的围棋程式—AlphaGo△Zero,它具备自我教学能力,已成为历史上最强大的围棋棋手。

之前的AlphaGo版本主要是以数千盘人类棋手的对战进行训练,包含业余与专业棋手,然而AlphaGo△Zero跳过了此一步骤,在完全不懂围棋的状况下自己跟自己对战,由于它内建了具备强大搜寻演算能力的神经网络,因此能不断调整与更新,以预测棋子的落点。

AlphaGo△Zero通过强化学习模式让它成为自己的老师,当中完全没有人类的干预,也未使用历史棋战资料,只花了40天便成为史上最强的棋手。

一开始的AlphaGo△Zero只知道围棋的基本规则,却在3天后就打败了AlphaGo△Lee,这是在2015年与李世乭的5盘对战中拿下4盘的AlphaGo版本;21天后它达到与AlphaGo△Master同样的能力,此为今年于网络上与60名专业棋手对战拿下全胜纪录,并击败柯洁的AlphaGo版本,40天后它便超越了所有的AlphaGo版本。

DeepMind指出,AlphaGo△Zero所使用的技术远比之前的AlphaGo还要强大,因为它不再受限于人类的知识,而是向全球最厉害的棋手学习—AlphaGo△Zero自己。

随着演算法的进化,AlphaGo所使用的运算资源也愈少(下图),早期的AlphaGo△Fan使用176个GPU,之后便改采Google自行发展的AI处理器(Tensor△Processing△Unit,TPU),AlphaGo△Lee使用了48个TPU,AlphaGo△Master与AlphaGo△Zero皆只使用4个TPU。

尽管AlphaGo△Zero仍然以围棋为开发范本,但DeepMind认为类似的技术将可被应用在其他的结构化问题上,例如蛋白质折叠、降低能源损耗,或是寻找革命性的新材料等,将有潜力对社会带来正面的影响。

AlphaGo△Zero的研究报告已于本周发表于《自然》(Nature)期刊上。

?

AlphaGo△Zero介绍视频:

tags:

上一篇  下一篇

相关:

别在自我安慰了 小时候胖就是胖,国健署3方向“脱肥”

我酷新闻网记者黄兴文/台北报道小时后胖不是胖?可别让错误的迷思害了。根据统计,小学时期肥胖,长大后成胖子的比率高达7成,由此可知,小时候的肥胖可是会延续到成人时期。国健署表示,105年十大死因中有7项与肥胖

SAP以3.5亿美元买下以色列新创Gigya,强化客户身份管理能力

示意图,与新闻事件无关。 企业应用软件开发商SAP于本周日(9/24)宣布将买下专门提供客户身份管理服务的以色列新创业者Gigya,双方并未公布交易金额,但外传此一交易价值3.5亿美元。创办于以色列的Gigya将总部设在

Google自然语言API新增内容自动分类与个体情绪分析能力

图片来源: Google Google周二(9/19)宣布, 已于Cloud自然语言API(Cloud△Natural△Language△API)新增内容自动分类与个体情绪分析能力,以协助企业组织内容与理解使用者的感受。Google的Cloud△Natural△Languag

报告:ICO吸金能力大过创投、知名众筹平台

图片来源: CoinDesk 专注于观察数位货币产业的CoinDesk在上周公布了今年第二季的区块链状态报告(Q2 2017 State△of△Blockchain),指出加密货币的总价值已达到981亿美元,比第一季的259亿美元增加了278.6%,且期间

Netflix致力于原创电影的真正原因?内容长给出了答案

我酷新闻网记者洪雅筠/综合报道Netflix近年来不断致力于原创电视影集的制作,虽Netflix现已坐拥超过1亿的用户数,甚至在美国的订阅数超越有线电视,但这些仍无法停止Netflix想要继续壮大的决心,现在他们更将大量的资

站长推荐: