苹果正在推出一种人工智能模型，可以根据文本命令编辑照片

苹果它不是当今人工智能游戏中的顶尖玩家之一，但该公司用于照片编辑的新开源人工智能模型显示了它可以为该领域做出的贡献。该模型称为 MLLM 引导图像编辑 (MGIE)，它在处理图像时使用多模态大语言模型 (MLLM) 来解释基于文本的命令。换句话说，该工具能够根据用户键入的文本编辑图像。尽管它不是第一个可以做到这一点的工具，但“人类指令有时太简短，现有方法无法捕捉和遵循。” 项目表 (PDF) 阅读。

该公司与加州大学圣巴巴拉分校的研究人员共同开发了 MGIE。 MLLM 能够将简单或模糊的文本提示转换为图像编辑器本身可以遵循的更详细、更清晰的指令。例如，如果用户想要编辑意大利辣香肠披萨的图像以“使其更健康”，MLLM 可以将其解释为“添加蔬菜配料”并照此编辑图像。

除了对图像进行重大更改之外，MGIE 还可以通过文本提示对图像进行裁剪、调整大小和旋转，以及提高其亮度、对比度和色彩平衡。它还可以修改图像的特定区域，例如修改图像中人物的头发、眼睛和衣服，或者删除背景中的对象。

喜欢 风险节拍 注释，苹果通过 github，但有兴趣的人也可以尝试一下实验性的目前托管在 Hugging Face Spaces 上。苹果尚未明确表示是否计划将从该项目中学到的知识用于可集成到其任何产品中的工具或功能中。

Peng Guowei

“驕傲的網絡狂熱者。微妙迷人的推特怪胎。讀者。互聯網先驅。音樂愛好者。”

READ 研究发现你的音乐偏好和你的道德指南针之间存在联系

苹果正在推出一种人工智能模型，可以根据文本命令编辑照片

实际上，您可以节省 50% 的新 Google 手机价格

三星电子重返充满活力的悉尼市并重新建立合作伙伴关系 – Samsung Newsroom Australia

人工智能有望促进药物发现，但信任问题悬而未决

斯科蒂·舍夫勒 (Scottie Scheffler) 在 PGA 锦标赛第二轮比赛前被捕

实际上，您可以节省 50% 的新 Google 手机价格

一名妇女解释为什么她想在 29 岁时结束自己的生命，因为她获得了安乐死的批准

台湾外长称中俄相互支持“扩张主义”

發佈留言 取消回覆

More Stories

实际上，您可以节省 50% 的新 Google 手机价格

三星电子重返充满活力的悉尼市并重新建立合作伙伴关系 – Samsung Newsroom Australia

人工智能有望促进药物发现，但信任问题悬而未决

You may have missed

斯科蒂·舍夫勒 (Scottie Scheffler) 在 PGA 锦标赛第二轮比赛前被捕

实际上，您可以节省 50% 的新 Google 手机价格

一名妇女解释为什么她想在 29 岁时结束自己的生命，因为她获得了安乐死的批准

台湾外长称中俄相互支持“扩张主义”

發佈留言取消回覆