昇腾亲和的多模态加速系列套件,现已支持vLLM Omni,Diffusers+CacheDit等框架。
MindIE SD
📢 Latest News
- 12/31/2025: MindIE SD提供稀疏Attention计算能力
- 12/25/2025:vLLM Omni x MindIE SD 实现 Qwen-Image-Edit-2511 / Qwen-Image-Layered 昇腾原生高性能推理
- 11/30/2025:MindIE SD 正式宣布开源并面向公众开放!会议日历
🚀 简介
MindIE SD(Mind Inference Engine Stable Diffusion)是 MindIE 的视图生成推理模型套件,它的目标是为稳定扩散(Stable Diffusion, SD)系列大模型提供在昇腾硬件及其软件栈上的端到端推理解决方案。该软件系统内部集成了各功能模块,并对外提供统一的编程接口。
以下是两个 MindIE-SD 代码仓库智能体,只需点击 "Ask AI" 徽章,即可进入其专属页面,有效缓解源码阅读的困难,开启智能代码学习与问答体验!它们将帮助您更深入地理解 MindIE-SD 的运行原理,并协助解决使用过程中遇到的问题与错误。
🔍目录结构
|- benchmarks // 提供核心kernel的性能看护和compilation的加速效果看护
|- build // 编译脚本
|- csrc // 昇腾kernel代码位置
|- docs // 项目文档
|- examples
|- cache // cache特性样例:使能cache进行模型加速
|- service // 服务化样例:将命令行模式改造成服务化方式
|- wan // 模型推理样例:模型推理命令以及参数配置
|- mindiesd
|- cache_agent // 高阶特性:提供cache能力
|- compilation // 提供编译能力,基于fx graph实现自动改图(可依旧保持单算子下发)。
|- eplb // 高阶特性:提供专家并行负载均衡能力
|- layers // 提供基础的pytorch的layer接口
|- quantization // 高阶特性:提供量化能力
|- utils // 核心工具模块,提供共享的基础设施服务和通用功能
|- tests // 测试用例
📦 安装指南
安装步骤和环境依赖详见安装指导。
🚀 架构介绍及关键特性
MindIE SD 架构和关键特性详见架构介绍。 MindIE SD 支持魔乐社区、vLLM Omni、Cache Dit等框架/社区,现已支持主流扩散模型,对于部分 diffusers 模型进行了昇腾硬件亲和的加速改造,详见模型/框架支持情况,模型也支持手动改造,详见 examples。
📝 Paper Citations
@misc{RainFusion2.0@2025,
title = {RainFusion2.0: Temporal-Spatial Awareness and Hardware-Efficient Block-wise Sparse Attention},
url = {https://gitcode.com/Ascend/MindIE-SD.git},
note = {Open-source software available at https://gitcode.com/Ascend/MindIE-SD.git},
author = {Aiyue Chen and others},
year = {2025}
}
💖 联系我们
