Qwen Image Edit 量化使用说明

Qwen Image Edit 模型介绍

Qwen-Image-Edit 是阿里巴巴通义千问团队基于 Qwen-Image 图像基础模型推出的开源图像编辑模型,兼顾语义级改动(如风格、构图、物体增删与替换)与外观级细节控制,支持中英文画面内文字的精准修改。当前 msModelSlim 一键量化面向 Qwen-Image-Edit-2509 权重与 MindIE/Qwen-Image-Edit-2509 推理工程对接。

使用前准备

支持的模型版本与量化策略

模型系列 模型版本 模型仓库链接 W8A8 W8A16 W4A16 W4A4 时间步量化 FA3量化 异常值抑制量化 量化命令
Qwen-Image-Edit Qwen-Image-Edit-2509 Qwen-Image-Edit-2509 FA3+W8A8动态量化

说明:

  • ✅ 表示该量化策略已通过 msModelSlim 官方验证,功能完整、性能稳定,建议优先采用。
  • 空格表示该量化策略暂未通过 msModelSlim 官方验证,用户可根据实际需求进行配置尝试,但量化效果和功能稳定性无法得到官方保证。
  • 点击量化命令列中的链接可跳转到对应的具体量化命令。
  • 推荐使用MindIE-SD 3.0.0版本

Qwen Image Edit 量化支持

Qwen-Image-Edit-2509 的 Transformer 部分基于扩散与 Transformer 结构,msModelSlim 支持对其线性层等进行量化,并配合 online_quarotFA3 等流程;支持逐层量化,有利于降低量化过程中的内存占用。

量化特性

  • 逐层量化: 支持逐层处理,大幅降低内存占用
  • 单卡量化: 结合逐层量化特性,可实现在Atlas 800I/800T A2(64G)设备上的单卡量化

量化命令

Qwen-Image-Edit-2509 FA3+W8A8 动态量化

使用 quant_type 参数进行一键量化

W8A8(MXFP8)+FA3(FP8动态)

msmodelslim quant \
    --model_path /path/to/Qwen-Image-Edit-2509 \
    --save_path /path/to/qwen_image_edit_quantized_weights \
    --device npu \
    --model_type Qwen-Image-Edit-2509 \
    --quant_type w8a8f8 \
    --trust_remote_code True

配置文件说明

基础配置结构

以下结构与仓库内 qwen-image-edit-w8a8f8-mxfp.yaml 一致,便于理解各段含义:

apiversion: multimodal_sd_modelslim_v1

metadata:
  config_id: qwen-image-edit-w8a8f8-mxfp
  score: 90
  verified_tags:
    Qwen-Image-Edit-2509:
      - - MindIE-SD
        - Atlas_350
  label:
    w_bit: 8
    a_bit: 8
    is_sparse: False
    fa_quant: True

default_w8a8_dynamic: &default_w8a8_dynamic
  act:
    scope: "per_block"
    dtype: "mxfp8"
    symmetric: True
    method: "minmax"
  weight:
    scope: "per_block"
    dtype: "mxfp8"
    symmetric: True
    method: "minmax"

spec:
  process:
    - type: "linear_quant"
      qconfig: *default_w8a8_dynamic
      exclude: ['*txt_mlp.net.2*', '*img_mod.1*', '*txt_mod.1*']
    - type: "online_quarot"
      include:
        - "*"
    - type: "fa3_quant"
      qconfig:
        dtype: "fp8_e4m3"
        scope: "per_token"
        symmetric: True
        method: "minmax"
      include:
        - "*"
  save:
    - type: "mindie_format_saver"
      part_file_size: 0

  multimodal_sd_config:
    dump_config:
      enable_dump: False
    model_config:
      img_paths: ""
      prompt_file: ""

关键配置参数

元数据 (metadata)

  • config_id:配置标识,与文件名 qwen-image-edit-w8a8f8-mxfp 对应。
  • score:官方验证评分,数值越高表示该配置在验证场景下表现越稳定。
  • verified_tags:已验证的模型类型及对接环境标签;当前 Qwen-Image-Edit-2509 对应 MindIE-SD 推理与 Atlas_350 设备。
  • label:量化能力标签,便于检索与对照:
    • w_bit / a_bit:权重与激活位宽(均为 8)。
    • is_sparse:是否稀疏量化(当前为 False)。
    • fa_quant:是否启用 FA 量化(当前为 True,与下方 fa3_quant 流程一致)。

默认 W8A8 动态量化锚点 (default_w8a8_dynamic)

  • act / weight:线性层 W8A8 动态量化,per_block + mxfp8 + minmax,供 linear_quant 通过 YAML 锚点 *default_w8a8_dynamic 引用。

量化配置 (process)

  • linear_quant:对线性层等进行 W8A8(mxfp8)动态量化;exclude 中模式用于排除部分子模块,以稳定精度。
  • online_quarot:在线旋转相关配置,与注意力等模块配合。
  • fa3_quant:Flash Attention 3 路径上的 FP8 量化配置(如 fp8_e4m3per_token)。

保存配置 (save)

  • type:保存器类型,使用 mindie_format_saver
  • part_file_size:分片大小,0 表示不分片。

多模态配置 (multimodal_sd_config)

  • dump_config:校准数据导出相关;当前默认示例中 enable_dumpFalse。若后续开启校准 dump,需按一键量化协议与适配器约定配置。
  • model_config:可与推理参数对齐的占位字段,例如:
    • img_paths:输入图像路径(多图可用逗号分隔等约定,以推理仓为准)。
    • prompt_file:提示词文件路径。

更细的协议说明见:一键量化配置协议说明

FAQ

现象:量化时报错无法导入 qwenimage_edit 解决方案: 请按 MindIE/Qwen-Image-Edit-2509 将推理工程置于 Python 路径或按说明安装,使 qwenimage_edit.transformer_qwenimageqwenimage_edit.pipeline_qwenimage_edit_plus 可被正常导入。

现象:如何自定义量化配置? 解决方案: 可在 process 中调整 exclude/include、量化 dtype 与范围等;自定义配置需自行验证精度与兼容性,官方仅对最佳实践库中已验证配置提供保证。

附录

相关资源