PCMag编辑选择和审查产品独立。如果您通过附属链接购买,我们可以赚取佣金,这有助于支持我们的测试

Meta的最新AI比大多数人类更擅长外交

CICERO可以与其他玩家谈判、提供建议、分享信息并达成协议,但也知道他们什么时候在虚张声势。

通过马修·汉弗莱斯

我的经验

自2016年11月以来,我一直在PCMag工作,涵盖所有领域的技术和电子游戏新闻。在此之前,我在Geek.com工作了近15年,担任作家和编辑。在大学毕业后的前6年里,我作为一名专业游戏设计师与迪士尼、Games Workshop、20世纪福克斯和Vivendi合作。

阅读完整简介
(资料来源:Meta AI)

Meta的研究人员创造了一种人工智能能够玩外交游戏并击败大多数人类玩家。

随着Meta AI博客解释(在新窗口中打开)几十年来,《Diplomacy》一直被视为“AI领域近乎不可能的大挑战”,因为玩这款游戏需要的技能。的外交目标(在新窗口中打开)就是控制棋盘的大部分,但这是通过玩家之间的对话、结盟、达成协议以及发现其他玩家的虚张声势来实现的。

Meta接受了挑战,创造并训练了一个名为西塞罗(在新窗口中打开),在玩过不止一款游戏的《Diplomacy》玩家中排名前10%webDiplomacy.net(在新窗口中打开)).这是通过结合人工智能研究的两个不同领域:战略推理和自然语言处理来实现的。

人工智能是由一个可控的对话模型和一个战略推理引擎共同工作形成的。这使得CICERO可以预测其他玩家可能采取的行动,也可以预测那些玩家认为CICERO将采取的行动(战略推理)。然后,CICERO使用一套精心挑选的计划来与其他玩家进行对话,这样它就可以“协商、提供建议、分享信息和达成协议”(自然语言处理)。

AI能够在游戏中击败最好的玩家,例如国际象棋扑克和围棋都是通过自我强化学习进行训练的。因为《Diplomacy》要求玩家与人类玩家合作,所以这种方法并不管用。通常情况下,监督学习被用于这类游戏,但Meta表示这会创造一个“相对较弱且极易被利用”的对手。相反,Meta使用了一种迭代规划算法来“平衡对话的一致性和合理性”。

CICERO远非完美,可能会产生不一致的对话,但它足以给游戏中最好的玩家提供一个严肃的挑战。然而,Meta认为,通过创造这种人工智能而开发的技术可以在其他地方得到很好的应用。例如,允许语音助手与我们进行长时间的对话并教我们新技能。然后,这种AI有可能被用于电子游戏中,充当难以与人类玩家区分开来的逼真角色。

个人电脑的标志《战神》、《口袋妖怪》和《贝onetta 3》:我们预览2022年假期最热门的游戏
What's New Now<\/strong> to get our top stories delivered to your inbox every morning.","first_published_at":"2021-09-30T21:30:40.000000Z","published_at":"2022-08-31T18:35:24.000000Z","last_published_at":"2022-08-31T18:35:20.000000Z","created_at":null,"updated_at":"2022-08-31T18:35:24.000000Z"})" x-show="showEmailSignUp()" class="rounded bg-gray-lightest text-center md:px-32 md:py-8 p-4 mt-8 container-xs">

获取我们最好的故事!

报名参加最新动态让我们的头条新闻每天早上发送到您的收件箱。

本通讯可能包含广告、交易或附属链接。订阅时事通讯即表示您同意我们的服务使用条款隐私政策。你可以随时退订通讯。beplay体育苹果下载


感谢您的报名!

您的订阅已被确认。留意一下你的收件箱!

注册其他时事通讯beplay体育苹果下载

你会喜欢的PCMag故事

关于马修·汉弗莱斯

高级编辑

自2016年11月以来,我一直在PCMag工作,涵盖所有领域的技术和电子游戏新闻。在此之前,我在Geek.com工作了近15年,担任作家和编辑。在大学毕业后的前6年里,我作为一名专业游戏设计师与迪士尼、Games Workshop、20世纪福克斯和Vivendi合作。

我拥有两个学位:计算机科学学士学位和游戏开发硕士学位。我的第一本书,制作自己的像素艺术,在所有好的书店都能买到。

阅读马修的完整传记

请阅读马修·汉弗莱斯的最新报道

Baidu
map