主页>理财> 正文>

AlphaZero黑箱终于被打开！登顶5年后，人类揭开它学会下棋的奥秘

2022-11-18 10:58 | 来源:IT之家 | 编辑：肖鸥 | 阅读量：19624 |

AI是怎么学习知识的科学家敲开它的头骨看了看

两天前，DeepMind和谷歌大脑的一篇文章被收录在《美国国家科学院院刊》上本文的内容是以五年前发表的AlphaZero为例，研究神经网络是如何获取和理解象棋知识的

在内容上，研究人员重点关注神经网络如何学习，知识如何量化等问题。

有趣的是，他们发现:

在没有人类博弈指导的情况下，AlphaZero仍然形成了类似于职业棋手理解的概念体系研究人员进一步探索了这些概念形成的时间和地点

此外，他们还比较了AlphaZero和人类的开局棋型的区别。

有网友觉得这是一项意义深远的工作:

也有人觉得AlphaZero可以计算任何人类的行为特征。！

更多观察，往下看。

引爆头骨的神经网络。

AlphaZero于2017年由DeepMind发布，一鸣惊人。

这是一个神经网络驱动的强化学习器，专门研究国际象棋，包括残差网络主干，分离策略和值头。

它的输出函数可以表示如下，z是国际象棋排列:

为了研究AlphaZero是如何学习的，研究人员为人类理解国际象棋构建了一个函数C其中z0是象棋专用的布局概念，C以专业象棋引擎Stockfish 8的评测分数作为参考

然后从AlphaZero的角度出发，设置一个广义线性函数G作为探针，取不同层的值在设定下，G会不断逼近，研究者会观察G与之间的逼近程度，以确认系统是否理解相关概念

然后，研究团队随机选取10万场游戏作为训练集，观察AlphaZero的表现。

如下图所示，结果显示伴随着训练步数和ResNet网挡的增加，AlphaZero的分数越来越高，游戏过程中每一步对敌人的威胁也越来越大。

由于实验中的异常值，研究人员讨论了潜在的语义。

如下图，少数红点远离主流分布，残值也在红色虚线上方，说明人类对象棋的判断存在明显的C函数和G函数差异。

研究小组发现，这些数值对应的是，在国际象棋中，人类判断白方有利，同时在对局过程中可以进一步吃掉黑方皇后。

研究人员得出结论，这是由于AlphaZero的值头和参考评价函数编码方法和参考系统的不同。

此外，研究者还观察了人类棋手和棋谱编程的重要参数，这些参数伴随着训练过程而变化，包括:王者安全，总战力，机动性，棋谱威胁等等。

结果表明，开始时几乎为零，但伴随着训练的进行，模型中某些参数的权重，以王者的安全度和一兵一卒的总战力来表示，明显增加。

这让研究者相信，通过训练过程，AlphaZero已经逐渐掌握了原本没有教给它的相关重要概念或知识。

最后，研究者还重点研究了开局游戏和下棋风格的演变，发现AlphaZero的下棋路径选择伴随着时间的推移在缩小，而人类的下棋偏好和路径在增加。

研究人员表示，原因尚不清楚，但它反映了人类和机器神经网络的根本区别。

关于后续研究的方向，笔者建议下一步探索AI模型能否超越人类认知概念的范畴，学习新的东西。

团队介绍

托马斯·麦格拉思来自DeepMind他毕业于伦敦帝国理工学院，获得博士学位主要研究领域包括ML，人工智能安全和可解释性

第二，Andrei Kapishnikov，来自Google Brain，专门研究人工智能应用他之前在VMware和Oracle工作

值得一提的是，国际象棋大师弗拉基米尔·克拉姆尼克也参与了这个项目的研究。

参考链接:

。

郑重声明：此文内容为本网站转载企业宣传资讯，目的在于传播更多信息，与本站立场无关。仅供读者参考，并请自行核实相关内容。

上一篇：蓝海银行：坚守金融为民践行责任担当下一篇：返回列表

金融头条

1
天风证券给予中望软件买入评级研发投入持续加大下半年增速有望恢复

天风证券2008年8月8日发布研报称，给予中网软件买入评级评级原因主要包括:1)上半年疫情影响较大，下半年增速有望恢复，
2
消息称谷歌将入局折叠屏手机市场，鸿海代工

据中国台湾省《区域经济日报》报道，在三星即将推出新款折叠手机之际，有消息称谷歌也将加入折叠手机市场，由鸿海代工，这也将使
3
青睐养老目标基金机构布局万亿增量市场

当我还没毕业时，我就开始投资养老FOF基金我一个月投了几百块钱，数额不算大今年刚参加工作的22岁程序员李明告诉中国证券报
4
易观千帆重磅发布手机银行APP用户体验GX评测

作为银行金融服务线上场景渗透的有效抓手，当前手机银行APP已经成为其触达用户的重要渠道。随着银行发力场景服务平台成为发展
5
真我BudsAir3S上手：“乐”光宝盒？还整得挺好看！

作为真芽Air的主力耳机系列，一直以越级体验，用料扎实，价值出众的形象活跃在真无线蓝牙耳机市场面对新品BudsAir3S
6
诺基亚手机制造商HMDGlobal迎来新CEO

HMDGlobal首席执行官弗洛里安·塞奇今年10月突然宣布辞职，并没有宣布继任者。根据最新的信息，HMDGlo
7
光庭信息通过高新技术企业重新认定将继续享受相关税收优惠政策

——广庭信息发布公告称，根据国家高新技术企业认定管理网发布的《关于备案湖北省认定机构认定的2022年第二批高新技术企业的
8
全球最大养老基金GPIF罕见亏损近1900亿元

太突然了！巨人罕见亏损近1900亿。日本政府养老金投资基金，全球最大的养老基金GPIF在第二季度GPIF2022
9
大摩：供应状况没有改善美国汽车价格“高烧难退”

根据凯利的蓝皮书，今年6月美国新车平均售价刚刚超过48000美元，创下历史新高尽管二手车价格略低于5月份的峰值，但平均价
10
流媒体巨头Netflix大手笔推进游戏战略，但玩家数量有点尴尬

北京时间8月8日早间消息，有消息称，美国视频巨头网飞开始加速多元化发展，扩大游戏业务，准备在今年年底前将游戏内容数量增加

热点资讯

1
蓝海银行：坚守金融为民践行责任担当

努力工作，尽力而为开业五年来，蓝海银行秉承科技金融普惠百姓的使命，坚持金融为民服务的背景，与党委政府携手共进，帮助小微企
2
阿里高管解读财报：直播在销售额中占比贡献相对而言非常小，在双十一主要发挥

北京时间11月17日晚间消息，阿里巴巴今日发布了截至2022年9月30日的2023财年第二季度财报财报显示，阿里巴巴第二
3
汇添富基金总经理张晖：做指数投资界的主动选择者

日前，汇添富基金指数品牌发布会暨指数投资研讨会成功举办，汇添富指数品牌手指能添财富正式发布，意在向市场传达汇添富将以强大
4
达科为：生命科学研究服务及病理诊断领域的专业提供商

Davy成立于1999年11月，一直专注于生命科学研究服务，并不断向下游临床应用领域延伸在生命科学研究服务领域，公司通过
5
工信部：围绕人工智能、车联网等重大应用需求，加强与全球集成电路产业界的合

据龚欣微新闻报道，11月17日，2022年世界集成电路大会在安徽合肥召开工业和信息化部副部长王江平在致辞中表示，集成电路
6
SecuritySpy软件可将苹果Mac设备轻松打造成家用监控系统

虽然目前市面上有很多成熟的CCTV视频监控解决方案，但是这些解决方案对于普通用户来说过于复杂可是，Mac用户可以使用Se
7
AppleWatch端亚马逊有声读物应用Audible更新：可不再依赖苹

AppleWatch的亚马逊有声读物应用Audible今天获得了重大更新:它可以不再依赖iPhone连接在AppleWa
8
网易：暴雪游戏营收及利润贡献占比仅为个位数?对公司业绩无重大影响

网易在HKEx上宣布，其在中国大陆的暴雪游戏发行许可证将根据条款和条件于2023年1月23日到期，不再续签受影响的游戏有
9
俞敏洪：中国未来30年会出现大学生厌倦城市热潮

余说，我非常关注大学生返乡下乡工作我一直认为未来30年中国会出现这样的热潮，大量大学生会厌倦在城市工作，或者在城市找的工
10
央视发布2022世界杯版权保护声明：仅抖音、咪咕等6家有授权

2022年世界杯即将在卡塔尔开幕，揭幕战将于当地时间11月20日19时举行。作为全球最受关注的赛事之一，它的转播

精彩推荐

1
远程开发更强大：微软GitHubCodespaces已与JetBrain

，JetBrains宣布与微软GitHub达成合作，提供GitHubCodespaces和JetBrainsGatewa
2
从巨鹿路、愚园路到延安中路一家茶馆的在沪15年

一阵微风袭来，楼道里的竹风铃此起彼伏，韵律优美，每一件都以不同的方式摇摆，房间里的客人，推着灯，抿着茶，轻声细语，每个表
3
鲁商发展变身纯“医美股”

日前，商辂发展发布公告称，公司拟将其与房地产开发业务相关的资产和负债转让给公司控股股东山东省商业集团有限公司或其关联公司
4
钱来了！多地提高低保标准还发生活补贴

真金白银来了！最近出台了很多提高城乡低保标准的文件，对低保和特困人员也发放了一次性生活补助有你在的地方吗提高最低生活
5
网易：第三季度营收244亿元同比增长10.1%，代理暴雪游戏收入占比仅为

目前处于风口浪尖的网易今天下午发布了2022年第三季度财报。财报显示，网易2022年第三季度营收为244亿元，去
6
中国疾控中心：“落地检”并不与核酸检测结果全国互认相悖

落地检查措施实施以来，各地为及时发现来自高危地区的风险人员，实现跨区域疫情传播的早期发现，避免引发本地相关疫情发挥了重要
7
半年内三次获大股东增持！还有20个董高监增持在路上……

短短半年时间，南京银行已被大股东增持三次。最近几天，南京银行发布公告称，收到持股比例超过5%的大股东江苏交通控股有限
8
11月发射的中星19号卫星成功定点，载荷工作正常

据中国卫通消息，中星19号卫星于11月12日晚成功固定至工作轨道，完成通信天线展开和载荷设备启动目前，中星19号卫星正在
9
欧派家居获浙商证券买入评级近期获4份券商研报关注目标均价涨幅35.67%

浙商证券2007年8月7日发布研究报告称，给予欧陆家园买入评级评级原因主要包括:1)募集20亿可转债建设华中基地，预计2
10
曝苹果iPadPro2022款将配备新的两个“四针”SmartConne

，有新消息称，苹果2022款iPadPro12.9"和11"将配备全新的"四针"智能连接器，这是对iPadPro中目前的

AlphaZero黑箱终于被打开！登顶5年后，人类揭开它学会下棋的奥秘

天风证券2008年8月8日发布研报称，给予中网软件买入评级评级原因主要包括:1)上半年疫情影响较大，下半年增速有望恢复，

据中国台湾省《区域经济日报》报道，在三星即将推出新款折叠手机之际，有消息称谷歌也将加入折叠手机市场，由鸿海代工，这也将使

当我还没毕业时，我就开始投资养老FOF基金我一个月投了几百块钱，数额不算大今年刚参加工作的22岁程序员李明告诉中国证券报

作为银行金融服务线上场景渗透的有效抓手，当前手机银行APP已经成为其触达用户的重要渠道。随着银行发力场景服务平台成为发展

作为真芽Air的主力耳机系列，一直以越级体验，用料扎实，价值出众的形象活跃在真无线蓝牙耳机市场面对新品BudsAir3S

HMDGlobal首席执行官弗洛里安·塞奇今年10月突然宣布辞职，并没有宣布继任者。 根据最新的信息，HMDGlo

——广庭信息发布公告称，根据国家高新技术企业认定管理网发布的《关于备案湖北省认定机构认定的2022年第二批高新技术企业的

太突然了！巨人罕见亏损近1900亿。 日本政府养老金投资基金，全球最大的养老基金GPIF在第二季度GPIF2022

根据凯利的蓝皮书，今年6月美国新车平均售价刚刚超过48000美元，创下历史新高尽管二手车价格略低于5月份的峰值，但平均价

北京时间8月8日早间消息，有消息称，美国视频巨头网飞开始加速多元化发展，扩大游戏业务，准备在今年年底前将游戏内容数量增加

努力工作，尽力而为开业五年来，蓝海银行秉承科技金融普惠百姓的使命，坚持金融为民服务的背景，与党委政府携手共进，帮助小微企

北京时间11月17日晚间消息，阿里巴巴今日发布了截至2022年9月30日的2023财年第二季度财报财报显示，阿里巴巴第二

日前，汇添富基金指数品牌发布会暨指数投资研讨会成功举办，汇添富指数品牌手指能添财富正式发布，意在向市场传达汇添富将以强大

Davy成立于1999年11月，一直专注于生命科学研究服务，并不断向下游临床应用领域延伸在生命科学研究服务领域，公司通过

据龚欣微新闻报道，11月17日，2022年世界集成电路大会在安徽合肥召开工业和信息化部副部长王江平在致辞中表示，集成电路

虽然目前市面上有很多成熟的CCTV视频监控解决方案，但是这些解决方案对于普通用户来说过于复杂可是，Mac用户可以使用Se

AppleWatch的亚马逊有声读物应用Audible今天获得了重大更新:它可以不再依赖iPhone连接在AppleWa

网易在HKEx上宣布，其在中国大陆的暴雪游戏发行许可证将根据条款和条件于2023年1月23日到期，不再续签受影响的游戏有

余说，我非常关注大学生返乡下乡工作我一直认为未来30年中国会出现这样的热潮，大量大学生会厌倦在城市工作，或者在城市找的工

2022年世界杯即将在卡塔尔开幕，揭幕战将于当地时间11月20日19时举行。 作为全球最受关注的赛事之一，它的转播

，JetBrains宣布与微软GitHub达成合作，提供GitHubCodespaces和JetBrainsGatewa

一阵微风袭来，楼道里的竹风铃此起彼伏，韵律优美，每一件都以不同的方式摇摆，房间里的客人，推着灯，抿着茶，轻声细语，每个表

日前，商辂发展发布公告称，公司拟将其与房地产开发业务相关的资产和负债转让给公司控股股东山东省商业集团有限公司或其关联公司

真金白银来了！最近出台了很多提高城乡低保标准的文件，对低保和特困人员也发放了一次性生活补助有你在的地方吗 提高最低生活

目前处于风口浪尖的网易今天下午发布了2022年第三季度财报。 财报显示，网易2022年第三季度营收为244亿元，去

落地检查措施实施以来，各地为及时发现来自高危地区的风险人员，实现跨区域疫情传播的早期发现，避免引发本地相关疫情发挥了重要

短短半年时间，南京银行已被大股东增持三次。 最近几天，南京银行发布公告称，收到持股比例超过5%的大股东江苏交通控股有限

据中国卫通消息，中星19号卫星于11月12日晚成功固定至工作轨道，完成通信天线展开和载荷设备启动目前，中星19号卫星正在

浙商证券2007年8月7日发布研究报告称，给予欧陆家园买入评级评级原因主要包括:1)募集20亿可转债建设华中基地，预计2

，有新消息称，苹果2022款iPadPro12.9"和11"将配备全新的"四针"智能连接器，这是对iPadPro中目前的

HMDGlobal首席执行官弗洛里安·塞奇今年10月突然宣布辞职，并没有宣布继任者。根据最新的信息，HMDGlo

太突然了！巨人罕见亏损近1900亿。日本政府养老金投资基金，全球最大的养老基金GPIF在第二季度GPIF2022

2022年世界杯即将在卡塔尔开幕，揭幕战将于当地时间11月20日19时举行。作为全球最受关注的赛事之一，它的转播

真金白银来了！最近出台了很多提高城乡低保标准的文件，对低保和特困人员也发放了一次性生活补助有你在的地方吗提高最低生活

目前处于风口浪尖的网易今天下午发布了2022年第三季度财报。财报显示，网易2022年第三季度营收为244亿元，去

短短半年时间，南京银行已被大股东增持三次。最近几天，南京银行发布公告称，收到持股比例超过5%的大股东江苏交通控股有限