与 CEO 们一起参加 7 月 26 日至 28 日的 Transform 人工智能与边缘周。 聆听高层领导讨论与 AL/ML 技术、对话式 AI、IVA、NLP、Edge 等相关的话题。 立即预订您的免费卡!
世界已经被最新的文本到图像技术提供的眼花缭乱 达尔-E 2 来自 OpenAI 和 想象 来自谷歌。 令人惊叹的美丽和创意系列由 人工智能 系统(人工智能)。 这是可能的,因为人工智能已经学会通过查看无数文本和图像来理解自然语言。
今天的系统经过训练,可以在输入文本和图像时输出新图像,以独特的方式将两个看似不同的事物结合在一起,这让观众很高兴。 可以选择传统图像(例如油画)来表达新事物或唤起完全不同的感觉。 这是一种获得创意的新方式。
转变创造力
想象一下,有了这项人工智能技术,用户不再需要滚动浏览大量图像结果来找到满足他们需求的最佳内容。 与图像搜索相比,人们创造了一些全新的东西,一些以前没有的东西,一些完全符合他们的欲望、突发奇想或内容方向的东西。 他们所要做的就是输入任何他们想要的内容,人工智能将绘制图像并创建图像,如所选文本中所示,例如,“请给我一张餐厅的照片,上面有 VentureBeat 标志火星上的窗户。”像这样的新系统将返回图片。 本质上,该系统是为人工智能而设计的。
当它也被发布以从描述情况和情绪的文本中创建视频时,这种创造力会呈指数增长,其中包含虚拟演员。 或者当 Text + AI 为您的视频和照片创作音乐时。
将文本转换为视频或音乐的技术已经在商业上可用,并且还在不断改进,从而为添加更多创造性过程开辟了潜力。 如果人工智能可以绘制图像或设计,人类设计师的角色就可以演变。 拥有伟大和鼓舞人心的想法可能变得更加重要,区分最佳和最差的能力将至关重要,因为绘画技巧可能会被人工智能取代。 那些不太熟练的人也可以用更少的努力开发他们的创意产品。
新的创意公司
但这不仅仅是为了发挥创造力可以做些什么,而是关于我们如何利用这项技术来影响我们的世界。 当然,有许多有趣甚至私密的用途可能会丰富我们的个人生活,但人工智能将如何重塑商业世界的创造力?
首先,它可以大大减少营销和广告团队花费的时间、金钱和资源。 新的活动可以在眨眼之间启动。 创造性的人工智能驱动设计将使团队能够对环境变化做出反应,对新闻或趋势做出反应,或者以全新的方式主动推出产品和服务。
此外,这些内容和材料可以很容易地以多种语言转录,利用人工智能使公司能够快速、轻松、经济地接触全球受众,帮助国际扩张。 这些都是投资用于创造性用途的人工智能技术的充分理由。
人类角色的演变
然而,许多人心中最大的问题是,部署这样的技术来扮演人类的角色意味着什么? 如果他们不再进行设计,是否需要他们? 我会争辩说,他们仍然在进行设计,只是使用了不同的工具,使其更容易、更具成本效益。
在人工智能系统可以增强创造过程的世界中,人类仍然需要承担更高级别的任务,例如提出想法、给出指示、评估、修改和做出最终决定——他们将拥有无限更多的选择。 . 他们将负责构建和定义配置项,但没有将它们放在一起的负担。 通过使用人工智能工具,人们可以更轻松地执行不同的活动,从而提高生产力和创造力。
滥用的可能性
与任何开创性技术一样,存在滥用的可能性。 我们都看到了图像、仇恨言论和错误信息如何在社交媒体上传播——是什么让人工智能生成的内容与众不同? 我认为我们的社会可以找到 道德 共识是以积极的方式使用技术,但我们可以选择在必要时进行监管。
一个潜在的问题可能是版权问题或应用于创意开发的人工智能系统的剽窃。 DALL-E 2 已经在网上使用了大量的图像进行了训练,并且可以返回与当前图像非常相似的图像。 同样,AI 作曲家、AI 音乐作品,甚至更多类型的 AI 生成算法也会出现问题。
例如,最近,具有人工智能生成的声音和面孔的虚拟人已经在全世界流行起来。 在这些情况下,虚拟人的面部或声音可能与基于大量训练数据的实际人的身份非常相似。
将人类规则应用于人工智能创作
但是我们的社会已经就人类剽窃写作或作者身份达成了共识。 对于人工智能,类似的指导方针可以应用于创作者,如果需要,基于人工智能的抄袭检查器可以帮助审查用户的决定,以确保绝对清晰。 人类处于控制之中。 内容创作者为文本、图像、视频和音频的组合方式制定了规则; 他们设定了轨道。
人工智能将被用于创意用途以提升品牌。 因此,使这些发展成为可能的人工智能供应商也可以根据他们拥有的许可关系类型、他们可以访问的图像的大小和质量、签约配音演员的范围、将这些资产组合成独特的足迹等等,如果需要更多的监督的话。
如果没有,新技术正在迅速发展,可以保护数字身份和图像的真实性。 例如,每个人的声音,每一张脸,都由数以万计的特征组成。 照片也是如此。 这使得在未经许可的情况下完全复制它们变得非常困难。
重要研究 Deepfake 检测已经在进行中。 相似地, 研究人员 数据科学家能够解构说话者声音的特征,以确定是在视频或音频剪辑中使用了独特的声音,还是通过战略性和适当的技术使用混合了许多声音的组合。
研究人员正在努力开发其他预防性解决方案。 科技行业正在从过去的错误中吸取教训,以保护未来,尤其是在人工智能方面。
我们正处于创造力可以实现巨大飞跃的时刻的边缘。 如果我们打开人类的思想去了解可能发生的事情,那么令人惊奇的事情将成为可能。
Taesu Kim 是 Neosapience 的首席执行官.
决定者
欢迎来到 VentureBeat 社区!
DataDecisionMakers 是专家(包括从事数据工作的技术人员)可以分享与数据相关的想法和创新的地方。
如果您想了解前沿理念和最新信息、最佳实践以及数据和数据技术的未来,请加入我们的 DataDecisionMakers。
你甚至可以认为 投稿 你自己!
“驕傲的網絡狂熱者。微妙迷人的推特怪胎。讀者。互聯網先驅。音樂愛好者。”
More Stories
《东京恶习》制片人详述日本走向全球制作中心之路
康拉德·科尔曼仅使用可再生能源再次改变了世界
新款 MacBook Pro 为苹果一周的重大新闻画上了句号