OpenAI 和谷歌根据 YouTube 视频转录文本来训练他们的人工智能模型,这可能侵犯了内容创作者的版权。 纽约时报。 该报告描述了 OpenAI、谷歌和 Meta 公司为最大限度地增加人工智能系统的数据量所做的努力,并援引了几位了解这些公司实践的人士的话。 就在几天前,YouTube 首席执行官尼尔·莫汉 (Neil Mohan) 在接受采访时表示…… 彭博起源 OpenAI 涉嫌使用 YouTube 视频来训练其新的文本到视频生成器 Sora, 这将违反平台政策。
根据 纽约时报,OpenAI 使用语音识别工具 Whisper 转录了超过一百万小时的 YouTube 视频,然后用于训练 GPT-4。 信息 我之前报道过 OpenAI 使用 YouTube 视频和播客来训练其人工智能系统。 据报道,OpenAI 负责人 Greg Brockman 也是该团队的成员之一。 谷歌发言人马特·布莱恩特表示,根据谷歌的规定,“未经授权剪辑或下载YouTube内容”是不允许的。 纽约时报还表示该公司并不知道 OpenAI 有任何此类使用行为。
然而,该报告称,谷歌内部有人知道 OpenAI 的情况,但没有采取任何行动,因为谷歌正在使用 YouTube 视频来训练其人工智能模型。 谷歌说 纽约时报 它仅对来自同意的内容创作者的视频执行此操作。 Engadget 已联系谷歌和 OpenAI 征求意见。
这 纽约时报 该报告还声称,谷歌于 2023 年 6 月要求一个团队修改其隐私政策,以涵盖其使用更广泛的公开内容(包括 Google Docs 和 Google Sheets)来训练其 AI 模型和产品。 谷歌称这些变化是为了清晰起见而做出的,并于 7 月份发布。 科比说 纽约时报 此类数据仅在已注册谷歌 Beta 功能测试的用户许可的情况下使用,并且该公司“尚未开始根据这种语言变化对其他类型的数据进行培训”。 此更改添加了 Bard 作为此数据用途的示例。
更正,美国东部时间 2024 年 4 月 6 日下午 3:45: 本文最初报道谷歌于 2022 年 6 月更新了其隐私政策。该政策更新实际上是在 2023 年进行的。我们对这个错误表示歉意。
More Stories
《东京恶习》制片人详述日本走向全球制作中心之路
康拉德·科尔曼仅使用可再生能源再次改变了世界
新款 MacBook Pro 为苹果一周的重大新闻画上了句号