InternVL 3.5 量化说明
模型介绍
- InternVL 3.5 是由上海人工智能实验室推出的多模态大模型书生·万象系列的最新版本。通过级联式强化学习(Cascade RL)、视觉分辨率路由器(ViR)与解耦视觉语言部署(DvD)等创新,InternVL 3.5在推理能力、部署效率与通用能力上实现了全面升级,支持图形用户界面(GUI)智能体、具身智能体、矢量图像理解与生成等新颖功能。
使用前准备
-
安装 msModelSlim 工具,详情请参见《msModelSlim工具安装指南》。
-
需安装依赖包:
pip install timm
InternVL 3.5模型当前已验证的量化方法
| 模型 | 原始浮点权重 | 量化方式 | 推理框架支持情况 | 量化命令 |
|---|---|---|---|---|
| InternVL3_5-38B | InternVL3_5-38B | W8A8量化 | vLLM Ascend | W8A8量化 |
Note
- 点击量化命令列中的链接可跳转到对应的具体量化命令。
使用示例
InternVL3_5-38B W8A8量化
该模型的量化已集成至一键量化,示例参数详见文档《一键量化完整指南》中的“参数说明”章节。
msmodelslim quant \
--model_path {model_path} \
--save_path {save_path} \
--device npu \
--model_type InternVL3_5-38B \
--quant_type w8a8 \
--trust_remote_code True