简介

多模态大模型推理流程中需要处理大量复杂的数据。Multimodal SDK 通过提供一系列高性能的昇腾设备亲和性接口，加速大模型推理预处理流程。

使用导引

软件架构

架构图模块介绍

模块	说明
vLLM 框架预处理插件	使用 vLLM 进行大模型推理时提供加速能力。Qwen2VL：使用 Qwen2VL 模型时提供图像/视频预处理加速能力，对比 transformers 的预处理时延可大幅度缩短。InternVL2：使用 InternVL2 模型时提供图像/视频预处理加速能力。
加速库	提供一系列高性能图像和张量处理接口。

产品系列	产品型号	操作系统版本
Atlas A2 推理系列产品	Atlas 800I A2 推理服务器	Ubuntu 22.04