如果非要问 AlphaGo 有什么缺点,那就是下棋不像人类和 AlphaGo 对弈过的顶级棋手都有这种感受,他们觉得 AI 落子经常让人捉摸不透
这不仅是 AlphaGo 的问题,许多 AI 系统无法解释,且难以学习如果想让 AI 与人类协作,就不得不解决这个问题现在,来自 Meta AI 等机构的研究者们打造出一个能战胜人类顶级棋手,且更容易复盘棋谱的 AI
他们用人类棋谱训练 AI 模仿,并让后者超越了人类。
上图分别展示了该方法在国际象棋,围棋的表现。
纵轴为 AI 与原始模型对弈的胜率,横轴为 AI 预测人类落子位置的 Top—1 准确度可以看出新的算法在两方面都已经超过了 SOTA 结果
像人类,还能打败人类
正所谓鱼与熊掌难以兼得AlphaGo 使用的自我博弈与蒙特卡洛树搜索,虽然练就了无比强大的 AI,但它的下棋更像凭直觉,而非策略如果要让 AI 更像人类,更应当使用模仿学习,但是这却很难让 AI 达到人类顶级棋手水准
Meta AI 和 CMU 的研究者发现,加入了 KL 正则化搜索后,一切都不一样了AI 的落子策略变得与人类棋手更加相似,这就是他们提出的新方法
piKL—hedge 的执行步骤如下:
在下图中,piKL—Hedge可以生成预测人类博弈的策略,其准确度与模仿学习相同,同时性能强 1.4 倍另一方面,在实现更高预测准确性的同时,piKL—Hedge 优于非正则化搜索的策略
本文共有三位共同一作,分别是来自 Meta AI 的 Athul Paul Jacob,David Wu,以及 CMU 的 Gabriele Farina。
Athul Paul Jacob 同时也是 MIT CSAIL 的二年级博士生,从 2016 年到 2018 年,他还在 Mila 担任访问学生研究员,在 Yoshua Bengio 手下工作,与 Bengio 共同发表了多篇论文。
David Wu 是 Meta AI 的国际象棋和围棋首席研究员。
Gabriele Farina 是 CMU 一名六年级博士生,曾是 2019—2020 年 Facebook 经济学和计算奖学金的获得者,他的研究方向是人工智能,计算机科学,运筹学和经济学。
另外,Gabriele Farina 还参与过著名的 CMU 德州扑克 AI 程序 Libratus 的开发。
论文地址:
。,联想小新Air14Plus酷睿版搭载i5—1155G7处理器,16GB+512GB版本首发价4399元,将于今日10:00开启预售,12月
12月16日,嘉里物流联网有限公司(“嘉里物流联网”;股份代号0636.HK)连续第五年蝉联Frost&Sullivan亚太区最佳实
记者从自治区商务厅获悉,12月17日,2021年来宾农产品产销对接活动在广州举办来宾市20家企业携近百种优质特色农副产品参加活动,现场签订采
学而思转型的非营利机构未能通过审批从明年开始,北京将不会再有任何学科类机构课程日前,不少家长在社交媒体上发文表示收到北京学而思的这一通知
近日,沃尔沃汽车RECHARGE全球云端发布会盛大召开,在本次发布会中,沃尔沃针对电气化发展战略作出了重要诠释,按沃尔沃对电气化发展的规划,
由广东进出口商会主办,深圳市天地纵横产业研究有限公司、深圳市天地纵横企业管理顾问有限公司承办,中国报关协会拱北关区代表处、广东深圳报关协会、
15日,冶金工业规划研究院发布《2022年我国钢铁需求预测成果》显示,通过采用钢材消费系数法和下游行业消费法对2021年和2022年我国钢材
□法治日报全媒体记者蒲晓磊 96枚金牌,60枚银牌,51枚铜牌! 8月24日至9月5日,第16届残奥会在日本东京举行在12天的赛程中,残
北京西城户籍人员成功创业一年以上可申请不超过4万元房租补贴 日前,北青—北京头条记者从西城区第二场两会发布会上获悉,西城区激励创新创业
园区作为中小企业的聚集地,在中小企业发展中发挥着重要作用。据公开数据显示,截至2021年7月,我国有国家级及省级开发区2728家,为数以万计
先驱网--综合性的生活资讯平台
邮箱:hchchc0324@163.com