深度学习,一种高级人工智能得益于丰富的数据和不断增强的计算能力,人工智能技术在过去几年中变得越来越流行。这是我们每天使用的许多应用程序背后的主要技术,包括在线语言翻译和社交媒体中的自动面部标记。
这项技术也被证明在医疗保健方面很有用:今年早些时候,麻省理工学院(MIT)的计算机科学家们使用深度学习来研究创建一个新的计算机程序用于检测乳腺癌。
经典模型需要工程师手动定义检测癌症的规则和逻辑,但对于这个新模型,科学家们提供了一个深度学习算法,从6万名患者身上扫描了9万张全分辨率乳房x光片,并让它找到最终患有乳腺癌的患者和那些没有患乳腺癌的患者的扫描之间的共同模式。它能够提前五年预测乳腺癌,比之前的风险预测模型有了很大的改进。
机器学习到底是什么?
深度学习是机器学习这是人工智能的一个分支,通过经验配置计算机来执行任务。与经典的基于规则的人工智能系统相反,机器学习算法通过处理带注释的示例来发展其行为,这个过程称为“训练”。
例如,要创建欺诈检测程序,您需要使用银行交易列表及其最终结果(合法或欺诈)来训练机器学习算法。机器学习模型检查了示例,并开发了合法交易和欺诈交易之间共同特征的统计表示。在此之后,当您向算法提供新的银行交易数据时,它将根据从训练示例中收集到的模式将其分类为合法或欺诈。
根据经验,你提供的数据质量越高,机器学习算法在执行任务时就越准确。
机器学习在解决规则没有很好定义且不能被编码成不同命令的问题时特别有用。不同类型的算法擅长不同的任务。
深度学习和神经网络
虽然经典的机器学习算法解决了许多基于规则的程序难以解决的问题,但它们在处理图像、视频、声音文件和非结构化文本等软数据方面表现不佳。
例如,使用经典的机器学习方法创建一个乳腺癌预测模型需要数十个领域专家、计算机程序员和数学家的努力,人工智能研究员和数据科学家杰里米·霍华德说(在新窗口打开).研究人员将不得不进行大量的特征工程,这是一个艰巨的过程,需要对计算机进行编程,以在x射线和核磁共振扫描中找到已知的模式。在此之后,工程师们在提取的特征之上使用机器学习。创建这样一个人工智能模型需要数年时间。
深度学习算法使用深度神经网络解决同样的问题,这是一种受人脑启发的软件架构(尽管神经网络是不同于生物神经元(在新窗口打开)).神经网络是一层又一层的变量,它们根据所训练的数据的属性进行自我调整,并能够执行诸如对图像进行分类和将语音转换为文本等任务。
人工神经网络(来源:维基百科)
神经网络尤其擅长在非结构化数据中独立地寻找共同模式。例如,当你在不同物体的图像上训练深度神经网络时,它会找到从这些图像中提取特征的方法。神经网络的每一层都检测特定的特征,如边缘、角落、面部、眼球等。
神经网络的顶层检测一般特征。更深层次检测实际对象(来源:arxiv.org)
通过使用神经网络,深度学习算法消除了特征工程的需要。以麻省理工学院的乳腺癌预测模型为例,得益于深度学习,该项目需要计算机科学家和领域专家付出的努力要少得多,开发时间也更短。此外,该模型还能够在乳房x光扫描中发现人类分析人员遗漏的特征和模式。
神经网络早在20世纪50年代就已经存在了(至少在概念上)。但直到最近,人工智能社区基本上对它们不屑一顾,因为它们需要大量的数据和计算能力。在过去的几年里,存储、数据和计算资源的可用性和可负担性将神经网络推向了AI创新的前沿。
深度学习的用途是什么?
在几个领域,深度学习正在帮助计算机解决以前无法解决的问题。
计算机视觉:计算机视觉是一门利用软件来理解图像和视频内容的科学。这是深度学习已经取得很大进展的领域之一。除了乳腺癌,深度学习图像处理算法还可以检测其他类型的癌症(在新窗口打开)和帮助诊断其他疾病(在新窗口打开).
但深度学习在你每天使用的许多应用程序中也根深蒂固。苹果的Face ID使用了深度学习,谷歌Photos也使用了深度学习来实现各种功能,比如搜索物体和场景以及纠正图像。Facebook使用深度学习来自动标记你上传照片中的人。
深度学习也会自动帮助社交媒体公司识别并屏蔽有问题的内容,例如暴力和裸体。最后,深度学习在使自动驾驶汽车了解周围环境方面发挥着非常重要的作用。
语音和语音识别:当你向亚马逊Echo智能音箱或谷歌助手发出命令时,深度学习算法会将你的语音转换为文本命令。一些在线应用程序使用深度学习来转录音频和视频文件。谷歌最近发布(在新窗口打开)这是一款设备上的实时Gboard语音转录智能手机应用,可以在你说话的时候使用深度学习来打字。
自然语言处理(NLP)和生成(NLG)自然语言处理,即提取非结构化文本含义的科学,一直是经典软件的历史痛点。用计算机规则定义书面语言的所有细微差别和隐藏含义几乎是不可能的。但是在大量文本预兆上训练的神经网络可以准确地执行许多NLP任务。
谷歌的翻译服务看到了一个性能突然提升(在新窗口打开)当公司转向深度学习时。智能音箱使用深度学习NLP来理解命令的各种细微差别,比如你询问天气或方向的不同方式。
深度学习在生成有意义的文本方面也非常有效,也称为自然语言生成。Gmail的智能回复和智能撰写使用深度学习为你的电子邮件提供相关回复,并建议你完成句子。OpenAI今年早些时候开发的文本生成模型可以生成长而连贯的文本摘录。
深度学习的局限性
尽管有这么多好处,深度学习也有一些缺点。
数据依赖关系:一般来说,深度学习算法需要大量的训练数据才能准确地执行任务。不幸的是,对于许多问题,没有足够的高质量训练数据来创建深度学习模型。
Explainability:神经网络以极其复杂的方式发展它们的行为——甚至它们的创造者也难以理解它们的行为。缺乏可解释性使得深度学习算法中的故障排除和错误修复变得极其困难。
算法的偏见:深度学习算法和它们所训练的数据一样好。问题是训练数据通常包含隐藏或明显的偏见,以及算法继承这些偏见.例如,一个主要针对白人照片进行训练的面部识别算法,在非白人上的表现就不那么准确了。
缺乏泛化:深度学习算法擅长执行有重点的任务,但不擅长概括它们的知识。与人类不同的是,一个被训练玩星际争霸的深度学习模型无法玩类似的游戏:比如魔兽争霸。此外,深度学习在处理偏离其训练示例的数据时表现不佳,也被称为“边缘情况”。在自动驾驶汽车等情况下,这可能会变得很危险,错误可能会导致致命的后果。
深度学习的未来
今年早些时候,深度学习的先驱被授予了图灵奖,这是计算机科学界的诺贝尔奖。但深度学习和神经网络的工作远未结束。各种改进深度学习的努力正在进行中。
一些有趣的工作包括深度学习模型可解释的:可解释的或可解释的这些神经网络可以发展它们的行为训练数据更少以及可以执行任务的边缘人工智能模型、深度学习算法而不依赖在大型云计算资源上。
尽管深度学习是目前最先进的人工智能技术,但它并不是人工智能行业的最终目标。深度学习和神经网络的发展可能会给我们带来全新的架构。