Descargitas

来自中国的最新突发新闻。

AI视频现在很奇怪很奇怪。 但他们要去哪里?

AI视频现在很奇怪很奇怪。 但他们要去哪里?

短视频给人的印象是一本移动的图画书,颤抖着从一个超现实的画面跳到下一个画面。 这是互联网模因制作者使用第一个广泛使用的文本到视频 AI 生成器的结果,描绘了不可能的场景,例如 巨石强森“巨石强森” 他吃石头和法国总统 马克龙 过滤和咀嚼垃圾,或普通物体的变形版本,例如 帕丽斯·希尔顿 自拍。

AI 生成的新视频浪潮与去年夏天风靡互联网的 Dall-E 有着明确的呼应,当时它对静态照片做了同样的把戏。 不到一年后,Dall-E 奇异的视觉效果几乎与现实难以区分,这引发了两个问题:AI 生成的视频会快速发展吗?它会在好莱坞占有一席之地吗?

模型Hugging Face,是由 AI 公司 Hugging Face 托管的视频生成器,它允许人们输入几个词并获得令人惊叹的拥抱视频作为回报。 Runway,联合创建图像生成器Stable Diffusion的AI公司, 宣布 三月下旬的文字转视频创作者,但尚未向公众广泛提供。 和 谷歌 双方都宣布他们将在 2022 年秋季开发文本转视频技术。

展示更多

现在,它是名人或泰迪熊画自拍的色情视频。 然而,在未来,人工智能在电影中的作用可能会超越病毒式的模因,让该技术能够协助拍摄、在拍摄前对场景进行建模,甚至可以让演员进出场景。 技术正在飞速发展,而这些生成器可能需要数年时间才能根据声明制作完整的短片(如果他们有能力的话)。 然而,人工智能在娱乐领域的潜力是巨大的。

“Netflix 颠覆了我们观看内容的方式和地点,我认为人工智能将进一步颠覆内容本身的实际创作,”技术教育公司 WAYE 的未来学家兼创始人 Sinead Bovell 说。

但这并不意味着人工智能很快就会完全取代编剧、导演和演员。 仍然存在一些重大的技术障碍。 视频看起来很快,因为 AI 模型还不能保持流畅视觉效果所需的完整帧到帧一致性。 创建持续时间长于奇怪、精彩的几秒钟并保持一致的内容需要更多的计算机能力和数据,这意味着对技术开发的大量投资。 “你不能轻易地缩放这些图像模型,”康奈尔大学计算机科学教授 Bharat Hariharan 说。

但是,即使它们看起来很简陋,但这些发电机的开发正在“非常、非常快”地发展,艾伦人工智能研究所的研究科学家 Jiacin Lu 说,该研究所是由已故的微软联合创始人保罗·艾伦创立的研究机构.

进步的速度是推动发电机发展的新发展的结果。 ModelScope 在文本和图像数据(例如图像生成器)上进行训练,然后还提供显示模型如何移动的视频 他应该 看,Hugging Face 的机器学习艺术架构师 Apolinário Passos 说。 这也是他使用的策略 . 它消除了注释视频的负担,或者用文本描述符对其进行分类,简化了过程,有利于技术的快速发展。

但这种生成视频技术不太可能将人类排除在电影制作过程之外。 Wonder Dynamics 是一家允许电影制作人将计算机生成的角色拖放到视频中的公司,并使用人工智能为视觉效果提供一种更便宜的方式来制作电影。 目标是添加更多虚构角色,例如外星人和机器人,以补充流程并使视觉效果更易于理解,而不是仅仅添加生成的人类来代替真人。 Wonder Dynamics 联合创始人 Nikola Todorovic 表示,如果电影失去了人情味,“电影的魔力”就会消退。 “如果没有人参与制作,电影还有什么意义呢?”

AI在电影中的成功,将取决于它能否重现那种魔力。 迄今为止的尝试很有趣,但最终令人失望或有害——提醒人们,仅仅因为 AI 英文内容并不代表 他应该. “Nothing, Forever”,永无止境的 AI 模仿 宋飞正传在主角“Larry Feinberg”告诉他之后,他在 2 月份被暂时禁止使用 Twitch 恐跨症 笑话。 剪辑后 威尔史密斯 把意大利面舀到他嘴里,这很可能是用 ModelScope 做的,它上周风靡一时,几乎立即被认为是“恶魔般的“ 和 ”震惊的. 正如 Jason Parham 本周早些时候为 WIRED 所写的那样,AI 已经将“幻想变成了直率。”这些 AI 创作可能会贬低人们的形象,剥夺人们对自己形象的控制权。“他们的表现很深刻,”Parham 写道。并用一把匕首。”

事实上,还有改进的余地,一些人认为这即将到来。 “我认为在未来有可能创造出可信且好的内容,可以唤起人类情感,但由人工智能演员执行,”Bofill 说。 她相信这可能会在未来十年内发生。 但即使有可能,关于这是否是公众想要的问题仍然存在。 “社会可能会决定一些感觉不对的事情,”她说。

这些视频还引发了其他伦理问题。 现在,文本到视频剪辑几乎令人难以置信。 但随着技术的进步,任何人都可以更轻松地仅使用几行文本来制作 Deepfake。 就像图像制作者一样,他们可能会因使用非专有图像而受到版权诉讼。

Passos 说,从单个生成器和几行文本创建整部电影或节目是一个很大的推动力,但结合不同的 AI 工具可以使之成为可能。 ChatGPT 可以编写文本,音频生成器可以读取它,视频生成器可以生成视觉效果,然后所有部分都可以一起编辑。 “你已经有了这些构建块,”帕索斯说。 “一个能做到这一切的模型可能会实现跨越式发展。但这些飞跃可能会在几周内实现。”

READ  新的 iOS 技术使得破解你的 iCloud 登录变得非常困难