DeepMind最近在开发方面的突破人工智能可以在星际争霸II中击败世界级玩家引起了很大的轰动。虽然DeepMind称这是一个重大突破,但其他人认为这是作弊,不公平的(在新窗口中打开)和超人的(在新窗口中打开).
但整个辩论表明,也许我们需要改变讨论和评估人工智能能力的环境,停止将其游戏玩法与我们自己的游戏玩法进行比较。
AlphaStar是DeepMind的星际争霸机器人,它使用深度学习技术人工智能流行领域在这个过程中,程序员通过提供大量的例子来开发他们的AI模型的行为。AlphaStar首先在暴雪发布的大型人类游戏数据数据库中进行训练,与自己对弈数百万局,学习并掌握星际争霸的规则。然后,它与人类进行了较量,横扫了DeepMind自己的业余选手,然后又与世界冠军进行了较量。
当AlphaStar击败世界上最好的两名棋手TLO和MaNa时,人们有理由相信人工智能行业已经走过了一个里程碑。在一篇博客文章中,DeepMind称之为AlphaStar(在新窗口中打开)“我们朝着创造智能系统的使命迈进了一步,有朝一日,智能系统将帮助我们解开一些世界上最重要、最基础的科学问题的新解决方案。”
但随之而来的是批评。
不公平的优势
批评人士声称,AlphaStar有几个特点,使其成为人类的不公平对手。
首先,AlphaStar的速度非常快。DeepMind的工程师表示,他们给AlphaStar设置了障碍,以防止它执行比人类能完成的更多的动作。但是人类玩家做了很多垃圾邮件点击,或者冲动行为没有价值,也没有思想。
例如,当玩家想要命令自己的单位移动到某个地点或攻击敌人时,他们通常会重复点击同一个地点或朝着目的地的轨迹,因为这会给人一种点击会加速行动的错误感觉。实际上,单元只执行最近的命令,而忽略之前的命令。相比之下,AlphaStar的每一步棋都很精确。
批评人士认为,这种不匹配让AlphaStar以超人的方式对比赛进行微观管理。例如,在涉及许多单位的大型战斗中,AlphaStar可以以其人类对手无法做到的速度和精度向每个单位发出单独的命令。在对AlphaStar业绩的分析中,ArsTechnica的蒂莫西描述了几个场景(在新窗口中打开)“阿尔法之星”的速度和精确度会给它带来不公平的优势。
其他分析人士指出,AlphaStar比人类棋手接收到更多的信息。打败MaNa和TLO的bot版本可以访问整个地图,而不是像人类玩家那样看到一个显示器的战场空间。但它仍然受到“战争迷雾”的限制,这意味着它无法从没有现役部队的地区获取信息。
但也有人批评AlphaStar的局限性:它只能扮演神族(《星际争霸》中的三个种族之一),而且只能在游戏的众多地图中的一张上玩。考虑到新的比赛和地图,AlphaStar可能会输给业余的人类对手,因为从AI的角度来看,这就像是在玩一场完全不同的游戏。
什么是公平竞争?
DeepMind还没有公布技术细节,但有些人怀疑,AlphaStar可能没有像人类那样处理原始像素,而是可以通过api(应用程序编程接口)访问原始游戏数据。
谢谢!但这并没有说明战胜专家的特定软件是使用了像素还是准备了APi,这两种软件都是可用的,但差别很大
——加里·马库斯(@GaryMarcus)2019年1月31日(在新窗口中打开)
Ars的Timothy B. Lee得出了这样的结论:“公平竞争的最终方法是让AlphaStar使用与人类玩家完全相同的用户界面。”这意味着,就像人类玩家盯着电脑显示器一样,AI只能访问游戏的图像,必须模拟击键、鼠标点击和滚动,而不是通过API调用与游戏交互。
如果我们期望人工智能完全复制人类的大脑和感官,这将是一个公平的观点。但深度学习和神经网络仍然是人工智能的前沿不同的限制这使得它们无法复制一些最基本的人类功能。
深度学习是一种狭义的人工智能,这意味着它非常擅长执行特定的任务,比如标记图像或识别语音,但它在概括任务或将其知识转移到其他领域方面很糟糕。问题领域越广,人工智能的能力就越有限,需要的训练也就越多。这就是为什么AlphaStar不能玩另一款RTS游戏,比如《魔兽争霸3》或《英雄连》。
AlphaStar也花了200年的时间去精通神族的一个关卡。学习玩人族或虫族(《星际争霸》的另外两个种族)可能需要花费同样的时间。相比之下,人类玩家可以迅速将他们从一款游戏中获得的知识移植到新游戏中。
我们距离通用人工智能(至少)还有几十年的时间,这种类型的人工智能可以与人类的认知能力相媲美。一些科学家认为我们永远无法成功地复制人类的大脑。
但狭义的人工智能非常擅长以非常快的速度处理大量信息。这就是为什么AlphaStar可以同时处理整个星际争霸地图。《星际争霸》的设计师本可以修改游戏,为玩家提供完整的游戏地图视图,但这可能会让玩家感到困惑,而不是帮助他们。人类也可以获得原始游戏数据,但这也无济于事。
人类处理数据的速度很慢,但有常识和抽象思维能力,使他们能够在没有完整信息的情况下计划和做出决定。这就是为什么他们喜欢有一个有限的地图视图,专注于战场的一个部分;与此同时,他们对游戏其他部分的情况有所了解,并能制定总体游戏计划。
AlphaStar在作弊吗?
考虑到人工智能和人类大脑之间的差异,公平地说,批评者的评估是正确的:DeepMind通过将AlphaStar限制在一张地图和一场比赛中,操纵了比赛,有利于AlphaStar。但是关于AlphaStar的争论可以给我们带来一些非常重要的结论。
首先,游戏的重点不应该是检查AI是否能够像人类一样点击和滚动。相反,我们应该关注AI在提供不完美信息和需要实时决策的游戏中的表现。在这方面,AlphaStar做得相当不错。
其次,《星际争霸》可能不是测试AI战略和计划能力的最佳场所。作为一个分析师指出(在新窗口中打开),“《星际争霸2》是一款可以被完美的机制所破坏的游戏。”这意味着人工智能可以用超人的速度和外科手术般的精确度来弥补其糟糕的战略技能。
最后,人工智能和人类智能是如此不同在两者之间创造一个公平的竞争环境可能是不可能的。规则上最小的改变都会迅速使游戏向一方或另一方倾斜,从而使竞争变得不公平。
我们应该寻找可以释放和测试人工智能的环境和环境,而不是用人为的限制来减缓它的发展。当人类和人工智能合作而不是竞争时,他们能取得什么成就?