腾讯游戏 AI「绝悟」击败王者荣耀电竞职业玩家

    图片来源:腾讯AI实验室

    在吉隆坡举办的王者荣耀最高规格电竞赛事——世界冠军杯半决赛的特设环节中,五位电竞职业选手组成的赛区联队,对阵腾讯王者荣耀 AI 绝悟。最终这场 5v5 的大战中, AI 战队团灭电竞职业高手战队。此战获胜,意味着腾讯策略协作型 AI 「绝悟」升级至王者荣耀电竞职业水平。

    绝悟,是腾讯 AI Lab 和与王者荣耀共同探索的前沿研究项目:策略协作型 AI。「绝悟」名字寓意绝佳领悟力,其技术研发始于2017年12月,并在2018年12月通过了顶尖业余水平测试(前职业选手与主播联队带来)。

    此次测试的「绝悟」版本建立了基于“观察-行动-奖励”的深度强化学习模型,无需人类数据,从白板学习(Tabula Rasa)开始,让 AI 自己与自己对战,一天的训练强度高达人类 440 年。AI 从0到1摸索成功经验,勤学苦练,既学会了如何站位、打野、辅助保护和躲避伤害等游戏常识。更惊喜的是,AI 也探索出了不同于人类常规做法的全新策略。团队还创建One Model模型提升训练效率,优化通信效率提升 AI 的团队协作能力,使用零和奖惩机制让 AI 能最大化团队利益,使其打法果断,有舍有得。

    游戏中测试的难点,是 AI 要在不完全信息、高度复杂度的情况作出复杂快速的决策。在庞大且信息不完备的地图上,10位参与者要在策略规划、英雄选择、技能应用、路径探索及团队协作上面临大量、不间断、即时的选择,这带来了极为复杂的局面,预计有高达10的20000次方种操作可能性,而整个宇宙原子总数也只是10的80次方。

    若 AI 能在如此复杂的环境中,学会人一样实时感知、分析、理解、推理、决策到行动,就可能在多变、复杂的真实环境中发挥更大作用。因此业界认为下一个 AI 里程碑,可能会在复杂策略游戏中诞生。世界顶级科技公司均在推进此类研究,如Google Deepmind(星际争霸2)、Facebook(星际争霸2) 及 Open AI(Dota 2)等。

    腾讯 AI Lab 一直是此类智能体研究的先行者。2016年起,研发的围棋 AI “绝艺”(Fine Art),现担任中国国家围棋队训练专用 AI ;2017年,启动“绝悟”研发;2018 年,“绝悟”达到业余顶尖水平,腾讯还在射击类顶级 AI 竞赛 VizDoom 夺冠,并在《星际争霸2》首先研发出击败内置 AI 的智能体。

    而长期应用上,“绝悟”将是腾讯攻克 AI 终极研究难题——通用人工智能的关键一步。AGI 代表研发能在通用系统中执行多种复杂命令,达到或超越人类水平的 AI ,从‘绝艺’到‘绝悟’,不断让 AI 从0到1去学习进化,并发展出一套合理的行为模式,这中间的经验、方法与结论,长期来看,有望在大范围内,如医疗、制造、无人驾驶、农业到智慧城市管理等领域带来更深远影响。

    不过,比较遗憾的是目前绝悟只是实验阶段,没有在游戏内开放。

     


    <声明>
    文章仅代表作者观点,不代表智能链立场,智能链(www.zhinengl.com)也不对真实性背书。
    智能链倡导知识分享,原创和编译文章(除非另有说明)欢迎转载,转载请注明出处、作者和原文链接。
    智能链尊重知识版权,遵循行业规范,转载稿件标明出处、版权归原作者或机构所有;所转载文章和图片仅用于行业交流,如有侵权,请您联系我们删除(editor#zhinengl.com)。