人工智能的下一个突破可能需要结束长期的竞争。
多年来,人工智能研究人员在创建解决问题的算法时通常采用两种方法之一:一种是符号,或基于规则的人工智能,其核心是手动将概念、规则和逻辑编码到计算机软件中;还有连接主义,它基于人工神经网络和大脑的数字表示,通过长期比较许多例子来有机地发展他们的行为。
直到最近,符号AI更受欢迎,神经网络被许多研究人员和公司所回避。但在2012年,多伦多大学的计算机科学家们有了突破(在新窗口打开)通过使用深度学习-基于神经网络的ai算法-赢得胜利ImageNet(在新窗口打开),一年一度著名的计算机视觉大赛。
从那时起,深度学习和神经网络引发了AI行业的革命,并帮助解决了以前被认为超出计算机能力的问题。今年早些时候,神经网络的先驱们被授予图灵奖(在新窗口打开)这个奖项相当于诺贝尔计算机科学奖。
随着神经网络越来越受欢迎,符号AI失宠,被推到了研究的边缘。但现在,深度学习革命已经进行了七年,我们已经看到了这一点深度学习并不是一个完美的解决方案并已限制其应用的明显弱点。
麻省理工学院和IBM的一组研究人员认为,人工智能的下一个突破可能来自结束符号人工智能和神经网络之间的竞争。
在本月早些时候国际学习表征会议(ICLR)上发表的一篇论文中,这些研究人员提出了一个名为“学习表征”的概念神经符号概念学习者(在新窗口打开),它将符号人工智能和神经网络结合在一起。这种混合方法可以创造出比传统模型更灵活的AI,并且可以解决符号AI和神经网络自己都无法解决的问题。
依赖标记数据是有限的
“深度学习非常强大,而且它不会消失。但今天它有局限性,”麻省理工学院- ibm沃森人工智能实验室主任大卫·考克斯说。“其中之一是它依赖于大量的数据。你需要有惊人数量的数据来训练其中一个系统,这些数据必须仔细注释。”
神经网络的核心是由数千个变量组成的复杂数学函数。在“训练”阶段,网络摄取大量标记的示例,并根据它在每一类示例中发现的共同模式调整变量。之后,当您通过网络运行一段新数据时,它可以根据其与网络之前看到的示例的统计相似性对数据进行分类。神经网络在图像分类、语音识别和自然语言处理等任务上尤其有效,这些领域是基于规则的人工智能历来难以解决的问题。
但这种对数据的依赖带来了严重的困难。考克斯说:“对于我们遇到的许多问题,我们只是没有足够的数据来训练目前的深度学习算法。”
根据经验,你拥有的训练数据质量越高,你的神经网络就会变得越精确。在许多情况下,你需要数百万个例子来进行足够的训练。
事实上,神经网络的概念几乎和人工智能本身一样古老。这主要是因为大量注释数据的可用性的增加,以及可以快速处理这些数据的计算机资源,使得该技术在过去几年变得实用起来。
Explainability是深度学习的另一个问题.很难调查和审计神经网络做出的决策,因为它们极其复杂,有自己的行为发展方式。这对它们在某些领域的应用提出了挑战,这些领域的错误可能会产生关键或致命的后果如法律规定人工智能系统的采用者为自动化决策提供解释。
符号人工智能和神经网络的结合
人工智能面临的一个艰巨挑战是视觉问答(VQA),你向人工智能展示一幅图像,并问它有关不同元素之间关系的问题。这很困难,因为VQA涉及图像识别、自然语言处理和逻辑推理等元素,这些任务最好由符号人工智能和神经网络协同工作来处理。
麻省理工学院和IBM的研究人员使用神经符号概念学习器(NSCL)来解决VQA问题。NSCL使用神经网络处理VQA问题中的图像,然后将其转换为包含对象的表格表示。接下来,它使用另一个神经网络来解析问题,并将其转换为一个符号AI程序,该程序可以在前一步生成的信息表上运行。
“将符号人工智能与神经网络结合起来——创建混合神经符号系统——有趣的事情之一是,你可以让每个系统做它擅长的事情。神经网络可以处理现实世界的混乱和相关性,并帮助将其转换为基于规则的系统可以使用的符号,从而更有效地运行,”考克斯说。
混合方法的好处
研究人员测试了NSCLCLEVR(在新窗口打开),一个用于VQA问题的渲染对象图像数据集。以前用纯神经网络方法解决CLEVR问题的尝试取得了令人印象深刻的结果,但它们需要大量的训练示例,并且开发的模型在边缘情况下表现不佳(网络没有经过训练的设置)。
NSCL被证明能够在CLEVR上用一小部分数据达到99.8%的准确率,因为它不是在数百万个例子中强行使用,而是开发了领域的概念表示,这使得它更容易处理以前没有见过的场景。这很重要,因为在许多领域,没有足够的高质量注释数据来训练神经网络来解决问题。
同时,NSCL在一定程度上解决了神经网络的可解释性问题。在传统的神经网络模型中,人工智能被提供了问题并输出结果,但没有线索表明它是如何解决问题的,因此纠正错误是困难的。相比之下,混合系统生成一个基于规则的程序,逐步描述其功能。
“在这里,你可以看到这个程序,你可以一步一步地看它做了什么。如果它得到了错误的答案,你可以看到为什么它得到了错误的答案,以及它在哪里出错了。如果它得到了正确的答案,您可以验证它是否出于正确的原因这样做。你可以理解和审核结果,”考克斯说。
创造真正AI的路线图
人工智能行业在不断发展,对于哪种方法是最好的,人们仍然没有达成共识。纠纷定期爆发(在新窗口打开).
在一个最近的博客文章(在新窗口打开)在美国,深度学习专家里奇·萨顿(Rich Sutton)列出了坚持深度学习、放弃试图将人类知识手动转化为计算机代码的方法的理由。
萨顿说:“从长远来看,唯一重要的是计算的杠杆作用。”“人类知识的方法往往使方法复杂化,使它们不太适合利用利用计算的一般方法。”(萨顿的观点不出所料地遭到了其他科学家的质疑,其中包括机器人先驱罗德尼·布鲁克斯(在新窗口打开).)
但正如IBM和麻省理工学院科学家的工作所表明的那样,前进的道路可能不是让两种方法相互对立,而是将它们结合起来,创造出比各部分之和更强大的东西。