我们已经看到人工智能程序可以做到生成仅仅是一行文字就能创造出看起来很专业的静态艺术,但现在Facebook的母公司Meta正将这项技术引入视频领域。
公司今天介绍做一个视频(在新窗口打开)它可以根据你的指令创建短视频。例如,它可以生成一个机器人在海浪中冲浪的片段,一个泰迪熊在画自画像,或者一艘飞船在火星上着陆。
虽然视频质量有点低,但结果仍然令人震惊,正如Meta首席执行官马克·扎克伯格所言显示(在新窗口打开)在演示中。这项技术能够逐帧创建一致、逼真的图像,没有任何重大缺陷。
扎克伯格在脸书上写道:“生成视频比生成照片要难得多,因为除了正确生成每个像素之外,系统还必须预测它们如何随着时间的推移而变化。”“Make-A-Video通过添加一层无监督学习来解决这个问题,使系统能够理解物理世界中的运动,并将其应用于传统的文本到图像生成。”
像其他人工智能艺术程序一样,Make-A-Video是根据“文本图像数据”或现有图像进行训练的,这些图像已经贴上了解释所描绘的物体、人物或场景的说明。但除此之外,这项技术还被编程为研究视频片段,以了解“世界是如何运动的”,Meta说(在新窗口打开).
“只需几个字或几行文字,Make-A-Video就能把想象力带到生活中,创造出充满生动色彩、人物和风景的独一无二的视频,”该公司补充道。“该系统还可以根据图像创建视频,或者将现有视频复制成类似的新视频。”
也就是说,这项技术并不完美。正如你在下面的视频中看到的,Make-A-Video不能完全复制运动感,特别是通过移动四肢。
![骑士](https://make-a-video.github.io/assets/T2V_samples/webp/1/A_knight_riding_on_a_horse_through_the_countryside_second_upsample__12.webp)
![熊猫](https://make-a-video.github.io/assets/T2V_samples/webp/1/A_panda_playing_on_a_swing_set_second_upsample__1.webp)
![走](https://make-a-video.github.io/assets/T2V_samples/webp/1/A_young_couple_walking_in_a_heavy_rain._second_upsample__10.webp)
不过,这个人工智能程序还是令人印象深刻的,它可能为任何人打开了一扇大门,让他们可以梦想自己想要的任何视频,而不用为好莱坞的特效付钱。但这也很可怕。不难想象,有人会滥用Make-A-Video来创造“deepfakes“并散布虚假信息。该系统也来自Meta公司,该公司一直在指责利益优先于阻止错误信息。
然而,Meta表示,该公司致力于负责任地开发人工智能技术。Meta在Make-A-Video网站上表示:“为了降低有害内容产生的风险,我们检查、应用和迭代过滤器,以减少有害内容在视频中出现的可能性。”
所有通过Make-A-Video生成的视频都将包含一个水印,以表明它是由人工智能创建的。该公司补充说:“我们的目标是最终让这项技术向公众开放,但目前我们将继续分析、测试和试用make - a - video,以确保发布的每一步都是安全和有意的。”
那些想在未来测试这项技术的人可以在这个页面上注册(在新窗口打开).你可以找到更多人工智能制作的视频样本在这里(在新窗口打开).