MultimodalSDK

文件	最后提交记录	最后更新时间
.gitcode	更新PR模板	18 天前
AccSDK	feat: Wheel 独立安装可用，简化构建部署流程	15 小时前
MultimodalSDK	feat: Wheel 独立安装可用，简化构建部署流程	15 小时前
build_script	feat: Wheel 独立安装可用，简化构建部署流程	15 小时前
docker	docs: Update README and rename quick_start.md to quickstart.md	7 天前
docs	feat: Wheel 独立安装可用，简化构建部署流程	15 小时前
examples	自动寻优第六次提交	8 小时前
pre-commit	chore: Add markdownlint configuration and update documentation	8 天前
scripts	doc: 社区资料易用性整改	8 天前
test	添加前冒烟测试用例	2 个月前
.codespellrc	doc: fix documentation usability	13 天前
.gitignore	feat: Wheel 独立安装可用，简化构建部署流程	15 小时前
.pre-commit-config.yaml	chore: Add markdownlint configuration and update documentation	8 天前
CONTRIBUTING.md	feat: Wheel 独立安装可用，简化构建部署流程	15 小时前
LICENSE.md	chore: Add markdownlint configuration and update documentation	8 天前
README.md	doc: 更新架构图，优化README和CONTRIBUTING	5 天前
mkdocs.yml	doc: 更新架构图，优化README和CONTRIBUTING	5 天前
requirements-docs.txt	doc: 社区资料易用性整改	8 天前
run_presmoke.sh	新增关键帧筛选算法	6 天前

自动翻译

Multimodal SDK

昇腾多模态大模型推理预处理加速工具

多模态大模型推理流程中需要处理大量复杂的数据。Multimodal SDK 通过提供一系列高性能的昇腾设备亲和性接口，加速大模型推理预处理流程，包括图像视频加载和解码、resize、crop 等预处理常用操作，并支持多种开源数据结构与加速库数据结构的相互转换，方便快速使用和移植。

类别	模块	功能简介	文档
加速库	功能函数	Tensor / Image / video_decode / load_audio 等预处理接口	功能函数参考
适配器	Adapter	Qwen2VL、InternVL2 模型预处理适配	Adapter
补丁	Patcher	vLLM 框架预处理加速补丁	patcher
API	Python 接口	数据类型枚举与接口目录	Python 接口说明

只需约 5 分钟，即可通过 Docker 快速启动环境并完成首次体验，详见快速入门。

详细的安装部署说明请参见安装指南。

详细的开发者文档请参见Multimodal SDK 开发者文档。

欢迎参与项目贡献，请参见贡献指南。

欢迎大家为社区做贡献，贡献前，请先签署开放项目贡献者许可协议（CLA）。

MultimodalSDK