PCMag编辑选择和审查产品独立.如果您通过附属链接购买,我们可能会赚取佣金,这有助于支持我们的测试。

人工智能(也是)一种善的力量

问问帕特·奎因(Pat Quinn)就知道了,由于“重新发声计划”(Project Revoice)和Lyrebird,这位渐冻症患者恢复了自己的声音,Lyrebird是少数几家使用人工智能克隆人声音的公司之一。

2017年,一种毁灭性的神经系统疾病——肌萎缩性侧索硬化症(ALS)夺走了著名“冰桶挑战”的创始人帕特·奎因的说话能力。

意见 2018年,人工智能帮他拿了回来。

多亏了机器学习而深度学习,人工智能算法已经变得非常擅长模仿人类。但是,尽管该领域有许多突出的发展都是消极的(在新窗口打开)人工智能的模仿能力对奎因来说是一种积极改变的力量。

“大多数患有肌萎缩性脊髓硬化症(ALS,也称为运动神经元疾病)的人最终会瘫痪,除了人造的‘电脑’声音外,他们无法与任何东西交流,”Oskar Westerdal说项目应答(在新窗口打开)这是一个旨在帮助像奎因这样的ALS患者的倡议。

为了重现奎恩的声音,“重新发声计划”与琴鸟(在新窗口打开)该公司是少数几家使用人工智能克隆人声音的公司之一,该集团还包括谷歌的WaveNet(在新窗口打开)而且Voicery(在新窗口打开)这是一家Y combinator支持的初创公司,使用人工智能创建合成语音记录。

深度学习如何生成人类声音

这些应用程序的背后是深度学习算法(在新窗口打开)这是人工智能的一个流行分支,它通过研究大量数据来获得传统基于规则的软件无法捕捉到的见解和模式。当你用足够多的录音来训练一个深度学习语音合成器时,它会创建一个代表人的声音的数字模型,并可以生成新的声音样本。

在人工智能语音合成技术出现之前,渐冻症患者不得不使用不是他们自己的通用数字声音。其他技术可以将预先录制好的句子与患者的声音拼接在一起,但结果过于人工,需要数十小时的语音录音,几乎没有用处。

另一方面,深度学习应用需要更少的数据,并提供更好的结果。“Lyrebird仅用几个小时的音频就能达到的效果是惊人的——它为人们提供了一个完整的数字语音克隆,所以他们可以说任何他们想说的话,”韦斯特达尔说。

重现无声者的声音

其中之一深度学习应用的局限性(在新窗口打开)他们依赖高质量的数据样本来训练他们的神经网络。ALS患者的问题是,一旦他们失去了声音,就不可能记录声音样本。幸运的是,奎因有几个小时的主题演讲和采访记录。

“最大的挑战是质量。这项技术完全依赖于有一致的、高质量的录音,并遵循精确的脚本——所以我们不得不与声音工作室合作,手动‘重录’,并转录我们能找到的帕特的每句对话。”韦斯特达尔说。

Lyrebird的联合创始人Jose Sotelo说:“我们有点担心我们无法提供高质量的声音来创造Pat的声音。”“由于我们无法获得干净的录音,人造声音的最终质量并不完美。我们认为我们可以用干净的录音做得更好。”

结果听起来还是有点不自然和合成。但对于一直使用普通声音进行交流的奎因来说,这种差异是巨大的。“通过这项新技术听到自己的声音后,我惊呆了!让患者知道,在渐冻症夺走他们的声音后,他们可以拥有自己的声音,这将改变ALS患者的生活方式,”他说。

奎因建议肌萎缩性侧索硬化症患者在为时已晚之前录下他们的声音。他说:“在再次听到自己的声音后,我需要ALS患者知道记录他们的声音是非常重要的。”

平衡AI合成器的负面用途

今年早些时候,一款基于人工智能的人脸交换应用FakeApp引发了一场热潮假色情视频有名人和政治家。有人担心FakeApp和Lyrebird等应用程序将会出现一个假新闻、欺诈和伪造的新时代

Lyrebird网站上的道德规范页面此前承认,这项技术“可能会产生危险的后果,比如误导外交官、欺诈,以及更普遍的由窃取他人身份引起的任何其他问题。”

为了说明这一点,该公司在网站上展示了几个例子合成记录(在新窗口打开)由唐纳德·特朗普和巴拉克·奥巴马的声音创作。

奎因的故事可能有助于揭示这个行业的积极方面,该行业因其应用程序的潜在令人毛骨悚然和不道德的使用而受到抨击。Lyrebird的Sotelo提醒道:“人们应该意识到这项技术的光明面。

除了医疗用途,人工智能合成器的应用还可以服务于其他生产目标。Voicery是为品牌提供定制化的数字化语音(在新窗口打开)由人工智能算法提供动力。谷歌也在尝试使用WaveNet为用户提供更自然的体验谷歌辅助设备的用户(在新窗口打开).这项技术在其他领域也很有用,包括自动有声读物或让电影配音变得更容易。

毫无疑问,道德和法律障碍将会出现,争论将会继续。但对奎因来说,人工智能是一种正向的力量。“我不想听起来像一台电脑,”他说。“我想听起来像我自己。”

个人电脑的标志人工智能公司GumGum创始人兼首席执行官Ophir Tanz谈到人工智能改变广告

What's New Now<\/strong> to get our top stories delivered to your inbox every morning.","first_published_at":"2021-09-30T21:30:40.000000Z","published_at":"2022-08-31T18:35:24.000000Z","last_published_at":"2022-08-31T18:35:20.000000Z","created_at":null,"updated_at":"2022-08-31T18:35:24.000000Z"})" x-show="showEmailSignUp()" class="rounded bg-gray-lightest text-center md:px-32 md:py-8 p-4 mt-8 container-xs">

获取我们最好的故事!

报名参加最新消息让我们的头条新闻每天早上发送到您的收件箱。

本通讯可能包含广告、交易或附属链接。订阅通讯即表示您同意我们的服务使用条款而且隐私政策.你可以随时退订时事通讯。beplay体育苹果下载


感谢您的报名!

您的订阅已确认。留意你的收件箱!

注册其他时事通讯beplay体育苹果下载

你会喜欢的PCMag故事

关于本·迪克森

本迪克森

本·迪克森是一名软件工程师和科技博主。他撰写有关颠覆性技术趋势的文章,包括人工智能、虚拟现实和增强现实、区块链、物联网和网络安全。本还经营着TechTalks博客。在Twitter和Facebook上关注他。

阅读本的完整传记

阅读本·迪克森的最新报道

Baidu
map