阿里 Qwen-Image-Edit-2509 模型更新发布,支持多图编辑、单图一致性提升
14 小时前 / 阅读约4分钟
来源:IT之家
阿里通义千问更新Qwen-Image-Edit-2509,新增多图编辑支持、单图一致性增强及原生ControlNet支持,现已开源。

IT之家 9 月 29 日消息,阿里通义千问今日宣布更新 Qwen-Image-Edit 的迭代版本 —— Qwen-Image-Edit-2509,现已在 HuggingFace 和魔搭社区开源,用户也可以通过 Qwen Chat 选择“图像编辑”功能免费体验最新模型。

相较于 8 月版本,Qwen-Image-Edit-2509 新增了如下特性:

  • 多图编辑支持:对于多图输入,Qwen-Image-Edit-2509 基于 Qwen-Image-Edit 结构,通过拼接方式进一步训练,从而进行了支持。提供“人物 + 人物”,“人物 + 商品”,“人物 + 场景”等多种玩法。

  • 单图一致性增强:对于单图输入,Qwen-Image-Edit-2509 显著提高了一致性,主要体现在以下方面:

    • 人物编辑一致性增强:增强人脸 ID 保持,支持各种形象照片、姿势变换;

    • 商品编辑一致性增强:增强商品 ID 保持,支持商品海报编辑;

    • 文字编辑一致性增强:除了支持文字内容修改外,还支持多种文字的字体、色彩、材质编辑;

  • 原生支持 ControlNet:包括深度图、边缘图、关键点图等。

Qwen-Image-Edit-2509 的首要更新是支持了多图输入。IT之家附官方示例如下:

我们先看一个“人物 + 人物”的例子:

我们再看一个“人物 + 场景”的例子:

下面是一个“人物 + 物体”的例子:

实际上,多图输入也支持 ControlNet 常用的关键点图,比如改变人物姿势:

类似的,下面几个例子展示了 3 张图片的效果:

Qwen-Image-Edit-2509 的另一个重要更新是提升了一致性

第一,在人物一致性上,Qwen-Image-Edit-2509 比 Qwen-Image-Edit 有了显著提升,下面展示了各种形象照片生成的例子:

再比如,更改人物的姿势,也可以很好的保持角一致:

基于这一点,加上 Qwen-Image 本身特色的文字生成能力,我们发现 Qwen-Image-Edit-2509 很擅长制作表情包:

人物的一致性也体现在老照片修复上,下面是两个例子:

当然,除了真实人物,生成卡通玩偶、文创也是可以的:

第二,Qwen-Image-Edit-2509 专门增强了商品的一致性。我们发现,模型可以通过白底商品图很自然的制作商品海报:

或者是简单的 logo:

第三,Qwen-Image-Edit-2509 专门增强了文字一致性,并且支持了包括字体类型编辑、字体颜色编辑和字体材质编辑。

此外,定点文字编辑的能力获得了大幅增强:

值得一提的是,文字的编辑常常也可以和图像的编辑交融在一起,比如下面这个海报编辑的例子:

Qwen-Image-Edit-2509 的最后一个更新是原生支持了 ControlNet 的常用的图像条件,比如关键点控制、草图等。

Qwen-Image-Edit-2509 开源地址:

https://modelscope.cn/models/Qwen/Qwen-Image-Edit-2509