简介

多模态大模型推理流程中需要处理大量复杂的数据。Multimodal SDK 通过提供一系列高性能的昇腾设备亲和性接口,加速大模型推理预处理流程。

  • 包括图像视频加载和解码,resize、crop 等预处理常用操作。
  • 支持多种开源数据结构与加速库数据结构的相互转换,方便快速使用和移植。

使用导引

场景 文档
Docker 快速体验(约 5 分钟) 快速入门
宿主机原生安装部署 安装部署
已安装,查阅 API Python 接口说明

软件架构

架构图模块介绍

模块 说明
vLLM 框架预处理插件 使用 vLLM 进行大模型推理时提供加速能力。Qwen2VL:使用 Qwen2VL 模型时提供图像/视频预处理加速能力,对比 transformers 的预处理时延可大幅度缩短。InternVL2:使用 InternVL2 模型时提供图像/视频预处理加速能力。
加速库 提供一系列高性能图像和张量处理接口。

支持的硬件和操作系统

产品系列 产品型号 操作系统版本
Atlas A2 推理系列产品 Atlas 800I A2 推理服务器 Ubuntu 22.04