Descargitas

来自中国的最新突发新闻。

AI视频现在很奇怪很奇怪。 但他们要去哪里?

AI视频现在很奇怪很奇怪。 但他们要去哪里?

短视频给人的印象是一本移动的图画书,颤抖着从一个超现实的画面跳到下一个画面。 这是互联网模因制作者使用第一个广泛使用的文本到视频 AI 生成器的结果,描绘了不可能的场景,例如 巨石强森“巨石强森” 他吃石头和法国总统 马克龙 过滤和咀嚼垃圾,或普通物体的变形版本,例如 帕丽斯·希尔顿 自拍。

AI 生成的新视频浪潮与去年夏天风靡互联网的 Dall-E 有着明确的呼应,当时它对静态照片做了同样的把戏。 不到一年后,Dall-E 奇异的视觉效果几乎与现实难以区分,这引发了两个问题:AI 生成的视频会快速发展吗?它会在好莱坞占有一席之地吗?

模型Hugging Face,是由 AI 公司 Hugging Face 托管的视频生成器,它允许人们输入几个词并获得令人惊叹的拥抱视频作为回报。 Runway,联合创建图像生成器Stable Diffusion的AI公司, 宣布 三月下旬的文字转视频创作者,但尚未向公众广泛提供。 和 谷歌 双方都宣布他们将在 2022 年秋季开发文本转视频技术。

展示更多

现在,它是名人或泰迪熊画自拍的色情视频。 然而,在未来,人工智能在电影中的作用可能会超越病毒式的模因,让该技术能够协助拍摄、在拍摄前对场景进行建模,甚至可以让演员进出场景。 技术正在飞速发展,而这些生成器可能需要数年时间才能根据声明制作完整的短片(如果他们有能力的话)。 然而,人工智能在娱乐领域的潜力是巨大的。

“Netflix 颠覆了我们观看内容的方式和地点,我认为人工智能将进一步颠覆内容本身的实际创作,”技术教育公司 WAYE 的未来学家兼创始人 Sinead Bovell 说。

但这并不意味着人工智能很快就会完全取代编剧、导演和演员。 仍然存在一些重大的技术障碍。 视频看起来很快,因为 AI 模型还不能保持流畅视觉效果所需的完整帧到帧一致性。 创建持续时间长于奇怪、精彩的几秒钟并保持一致的内容需要更多的计算机能力和数据,这意味着对技术开发的大量投资。 “你不能轻易地缩放这些图像模型,”康奈尔大学计算机科学教授 Bharat Hariharan 说。

但是,即使它们看起来很简陋,但这些发电机的开发正在“非常、非常快”地发展,艾伦人工智能研究所的研究科学家 Jiacin Lu 说,该研究所是由已故的微软联合创始人保罗·艾伦创立的研究机构.

进步的速度是推动发电机发展的新发展的结果。 ModelScope 在文本和图像数据(例如图像生成器)上进行训练,然后还提供显示模型如何移动的视频 他应该 看,Hugging Face 的机器学习艺术架构师 Apolinário Passos 说。 这也是他使用的策略 . 它消除了注释视频的负担,或者用文本描述符对其进行分类,简化了过程,有利于技术的快速发展。

但这种生成视频技术不太可能将人类排除在电影制作过程之外。 Wonder Dynamics 是一家允许电影制作人将计算机生成的角色拖放到视频中的公司,并使用人工智能为视觉效果提供一种更便宜的方式来制作电影。 目标是添加更多虚构角色,例如外星人和机器人,以补充流程并使视觉效果更易于理解,而不是仅仅添加生成的人类来代替真人。 Wonder Dynamics 联合创始人 Nikola Todorovic 表示,如果电影失去了人情味,“电影的魔力”就会消退。 “如果没有人参与制作,电影还有什么意义呢?”

AI在电影中的成功,将取决于它能否重现那种魔力。 迄今为止的尝试很有趣,但最终令人失望或有害——提醒人们,仅仅因为 AI 英文内容并不代表 他应该. “Nothing, Forever”,永无止境的 AI 模仿 宋飞正传在主角“Larry Feinberg”告诉他之后,他在 2 月份被暂时禁止使用 Twitch 恐跨症 笑话。 剪辑后 威尔史密斯 把意大利面舀到他嘴里,这很可能是用 ModelScope 做的,它上周风靡一时,几乎立即被认为是“恶魔般的“ 和 ”震惊的. 正如 Jason Parham 本周早些时候为 WIRED 所写的那样,AI 已经将“幻想变成了直率。”这些 AI 创作可能会贬低人们的形象,剥夺人们对自己形象的控制权。“他们的表现很深刻,”Parham 写道。并用一把匕首。”

事实上,还有改进的余地,一些人认为这即将到来。 “我认为在未来有可能创造出可信且好的内容,可以唤起人类情感,但由人工智能演员执行,”Bofill 说。 她相信这可能会在未来十年内发生。 但即使有可能,关于这是否是公众想要的问题仍然存在。 “社会可能会决定一些感觉不对的事情,”她说。

这些视频还引发了其他伦理问题。 现在,文本到视频剪辑几乎令人难以置信。 但随着技术的进步,任何人都可以更轻松地仅使用几行文本来制作 Deepfake。 就像图像制作者一样,他们可能会因使用非专有图像而受到版权诉讼。

Passos 说,从单个生成器和几行文本创建整部电影或节目是一个很大的推动力,但结合不同的 AI 工具可以使之成为可能。 ChatGPT 可以编写文本,音频生成器可以读取它,视频生成器可以生成视觉效果,然后所有部分都可以一起编辑。 “你已经有了这些构建块,”帕索斯说。 “一个能做到这一切的模型可能会实现跨越式发展。但这些飞跃可能会在几周内实现。”