PCMag编辑选择和审查产品独立.如果您通过附属链接购买,我们可能获得佣金,这有助于支持我们的测试。

这就是为什么人工智能公司必须听你的语音录音

语音助手和聊天机器人依赖于理解语言,但目前,它们只能在人类的帮助下了解含义和上下文。隐私就到此为止吧。

8月下旬,主板爆出新闻(在一个新窗口中打开)微软与承包商共享Xbox用户的语音记录,以改善其人工智能语音助手的功能。当月早些时候,另一份报告披露微软在分享(在一个新窗口中打开)Skype录音和Cortana与承包商的语音指令,以改善聊天平台的服务。有些录音含有私密内容。

微软只是几家雇佣人工来监听和注释用户生成数据的公司之一。最近几个月,谷歌、亚马逊、脸书和苹果公司都爆出了类似的程序,而苹果公司已经把自己确立为用户隐私的倡导者。

随着语音助手和聊天机器人越来越受欢迎,科技公司面临着一个艰难的挑战:他们的人工智能算法不是用来处理人类语言的复杂性的,它们经常无法理解用户说的命令和句子的意思。

目前,唯一的解决方案是雇佣人类来引导这些人工智能算法朝正确的方向发展。这通常需要让这些工作人员倾听用户的亲密对话,并对其进行转录和注释。

理解语言的挑战

基于语音的助手,如Alexa, Siri和Cortana的能力归功于先进的深度学习人工智能是人工智能的一个分支,在过去几年变得非常流行。深度学习算法特别擅长发现模式和分类信息。

当你为一个深度学习算法提供数百万个语音记录及其对应文本时,它可以以非常高的准确性转录新的音频摘录。深度学习还擅长预测:当你在大量文本语料库上训练一个AI算法时,它会对不同的单词序列发展出复杂的数学表示,并可以执行自动完成句子等任务。

连接社交媒体 好吧,也许不是。但Facebook希望人工智能能让你的信息流免于纳粹、机器人和假新闻。正确的

但深度学习与理解意思单词和句子,这是单纯的数学和统计无法完成的任务。

“语音识别和自然语言理解听起来似乎是类似的问题,但实际上它们完全不同,”认知科学家、Robust.AI的创始人兼首席执行官加里•马库斯(Gary Marcus)说。“在语音识别中,你的语言中音节和音素的数量是有限的,你试图将音频流翻译成属于非常小的一类的东西。”beplay3体育app手机版

英语有成千上万个常用词汇,在大数据时代,你可以很容易地找到数百万个每种词汇的例子,用来训练深度学习模型。但是解析句子并解释它们的意思是完全不同的努力。有无数可能的句子,每一个都有独特的含义。单词的意思根据它们在句子中的位置以及它们的前后位置而变化。

“除了几个小句子,你听到的几乎每句话都是原创的。你没有任何直接的数据。这意味着你在推理和理解方面有问题,”马库斯说。“把东西分类、把它们放进你已经知道的箱子里的技术很好,但并不适合这样做。理解语言就是把你对世界的已知知识和别人想要表达的意思联系起来。”

在他的新书中,重新启动人工智能(在一个新窗口中打开)(与纽约大学教授欧内斯特·戴维斯合作),马库斯解释了当代人工智能在破译人类语言含义时所面临的一些挑战。我们认为理所当然的一件事是我们每个人对这个世界的普遍认识,以及我们如何利用这些认识来理清口语和书面语的歧义。

日常对话中充满了这样的模棱两可。例如,考虑这句话,马库斯和戴维斯在他们的书中研究:“埃尔西试图在电话上联系她的姑姑,但她没有接。”这是一个简单的句子。但它也包含了几个含糊不清的地方,作为人类,您可以很容易地解决它们。听到这句话,你马上就会知道“reach”的意思是“沟通”而不是“身体接触”,“on the phone”的意思是“通过使用电话”而不是“身体接触电话”,“she”指的是埃尔西的阿姨而不是埃尔西本人。这些都是你可以不假思索地做出的推论,因为你知道电话是什么,它的用途是什么,以及打电话的过程是如何工作的。

无休止的训练循环

深度学习缺乏常识和对世界的了解,这让科技公司别无选择,只能用越来越多的例子来训练他们的AI模型,希望它们最终能涵盖所有可能的方式来表达他们的AI助手应该做的事情。这就是为什么他们需要人工工作者的帮助,通常是远程的、报酬低的,他们可以评估他们的人工智能算法的性能,或者转录和注释人工智能算法无法破译的用户记录。

但鉴于人类表达事物的方式无穷无尽,更多的训练最终将成为一个创可贴式的解决方案。总是会有异常值,AI没有接受过处理这些情况的训练;人类的语言是动态的,不断进化的。这一切都需要更多的培训,这意味着你会听到更多远程工作者偷听你私人谈话的故事。

我们的编辑推荐

什么是人工智能?

“当前技术的弱点在于它对数据的极度渴求,尤其是在自然语言理解等开放式问题上。因此,这些公司迫切希望获得这些数据。”“我不认为这真的会解决他们的问题。它会有一点帮助,但解决不了问题。”

如果没有办法将常识和基础知识嵌入到深度学习算法中,就无法在短期内解决问题。随着科技公司继续收集和注释用户数据,以训练他们的AI算法,他们将面临隐私倡导者的反弹,并可能面临数据保护机构的法律行动。这使得这些公司缓和并重组了他们的数据收集和共享程序,但并没有停止它们。

8月底,苹果在其网站上发布了一份未署名的道歉声明,为与承包商分享Siri语音指令道歉。该公司誓言只有当人们选择参加评估项目时,才能将他们的录音用于培训目的。谷歌已经停顿了一下该公司在欧洲的评估项目更为严格,但在其他领域,该项目仍在继续,丝毫未减。微软已经更新其隐私政策(在一个新窗口中打开)让你明白,人类承包商可能会听到你的声音。亚马逊已经改变了它的程序,让用户能够选择退出它的评估程序(在一个新窗口中打开)-许多用户会忽略或甚至不知道。

马库斯认为,从长远来看,我们需要对人工智能有新的看法:“我们需要更好的人工智能研究。这意味着将一种主要围绕数据和数学的文化,转变为一种融合了心理学、哲学和语言学等其他领域的其他思想的文化,这些思想对人类思维的运作方式进行了相当深入的思考,可能会催生出一套比我们现在看到的更丰富的构建人工智能的技术。”

个人电脑的标志人工智能开发自己的语言

What's New Now<\/strong> to get our top stories delivered to your inbox every morning.","first_published_at":"2021-09-30T21:30:40.000000Z","published_at":"2022-08-31T18:35:24.000000Z","last_published_at":"2022-08-31T18:35:20.000000Z","created_at":null,"updated_at":"2022-08-31T18:35:24.000000Z"})" x-show="showEmailSignUp()" class="rounded bg-gray-lightest text-center md:px-32 md:py-8 p-4 mt-8 container-xs">

获取我们最好的故事!

报名参加最新消息让我们的头条新闻每天早上送到您的收件箱。

本通讯可能包含广告、交易或附属链接。订阅通讯表明您同意我们的使用条款而且隐私政策.您可以随时取消订阅通讯。beplay体育苹果下载


感谢您的报名!

您的订阅已被确认。留意你的收件箱!

注册其他通讯beplay体育苹果下载

你会喜欢的PCMag故事

关于本·迪克森

本迪克森

本·迪克森是一名软件工程师和科技博主。他的文章涉及颠覆性技术趋势,包括人工智能、虚拟和增强现实、区块链、物联网和网络安全。本还经营着博客TechTalks。在Twitter和Facebook上关注他。

阅读本的完整简历

阅读本·迪克森的最新报道

Baidu
map