罕见!苹果开源图片编辑神器MGIE,要上iPhone?(ios 图片编辑app)

AIGC动态欢迎阅读

原标题:罕见!苹果开源图片编辑

神器MGIE,要上iPhone?

关键字:指令,编辑,视觉,模型,图像

文章来源:机器之心

内容字数:6499字

内容摘要:

机器之心报道

编辑:蛋酱、陈萍拍张照片,输入文字指令,手机就开始自动修图?

这一神奇功能,来自苹果刚刚开源的图片编辑神器「MGIE」。把背景中的人移除在桌子上添加披萨最近一段时间,AI 在图片编辑这一应用上取得了不小的进展。一方面,在 LLM 的基础上,多模态大模型(MLLM)可以自然地将图像视为输入,并提供视觉感知响应。另一方面,基于指令的编辑技术可以不依赖于详细描述或区域掩码,而是允许人类下达指令,直接表达如何编辑以及编辑图像的哪个方面。这种方法极具实用性,因为这种引导更符合人类的直觉。

基于上述技术的启发,苹果提出了 MGIE(MLLM-Guided Image Editing),将 MLLM 用于解决指令引导不足的问题。论文标题:Guiding Instruction-based Image Editing via Multimodal Large Language Models

论文链接:https://openreview.net/pdf?id=S1RKWSyZ2Y

项目主页:https://mllm-ie.github.io/

如图 2 所示,MGIE 由 MLLM 和扩

原文链接:罕见!苹果开源图片编辑神器MGIE,要上iPhone?

联系作者

文章来源:机器之心

作者微信:almosthuman2014

作者简介:专业的人工智能媒体和产业服务平台

0
分享到:
没有账号? 忘记密码?