MindIE-LLM:基于昇腾硬件的大语言模型推理加速套件

昇腾自研大模型推理引擎

分支6Tags2
文件最后提交记录最后更新时间
代码仓支持devcontainer, 降低开发人员本地构建门槛1 个月前
new: 新建文件 PULL_REQUEST_TEMPLATE.md5 个月前
[RFC]: 安全编译选项修改,禁止用runpath等1 个月前
[doc] update deepseek_v3.2.md12 天前
[Doc]全量README文档规范统一与内容修正,补齐DeepSeek-R1-Distill-Qwen配套资料并清理bge旧目录 [Part06]12 天前
修复runtime中的toolCallsProcessor未init的问题13 天前
[Doc]3.0.0安装兼容run和whl28 天前
code check代码检查1 个月前
[doc server] 添加文档托管网站基础设施1 个月前
mie_ops只编译一次1 个月前
[op] Update DispatchFFNCombine14 天前
提交DT运行和编译分离14 天前
[Feature]: Deepseek V3.2支持ascend c自定义算子接入2 个月前
恢复mindie-llm run包和atb-models tar包1 个月前
[dev]Synchronize code5 个月前
整改 gitignore、OWNERS、dockerfile1 个月前
[Doc]3.0.0安装兼容run和whl28 天前
[doc server] 添加文档托管网站基础设施1 个月前
【新需求】【重构】【编译工程】并行编译第三方包5 个月前
[doc ]修改doc tools工具扫描出来的低错问题2 个月前
[doc server] 添加文档托管网站基础设施1 个月前
恢复mindie-llm run包和atb-models tar包1 个月前
[doc ]修改doc tools工具扫描出来的低错问题2 个月前
[dev]Synchronize code5 个月前
[doc]修改服务化config的路径、大模型和AIDD工具低错,平移社区安装指南中的安全加固1 个月前
[doc server] 添加文档托管网站基础设施1 个月前
[RFC]: 刷新代码格式——mindie_llm1 个月前
【开源资料】添加缺失的 pybind11 依赖2 个月前
[doc ]修改doc tools工具扫描出来的低错问题2 个月前
将doc文档打包到whl包中1 个月前
恢复mindie-llm run包和atb-models tar包1 个月前
[dev]Synchronize code5 个月前

MindIE-LLM

昇腾大语言模型推理引擎

Zread     DeepWiki

📢 Latest News

  • [2026/04] 📖 文档站点上线!欢迎访问 MindIE-LLM 文档中心 在线阅读完整文档。
  • [2025/12] MindIE LLM 正式宣布开源并面向公众开放! 会议日历

🚀 简介

MindIE LLM是昇腾的大语言模型推理加速套件,旨在通过深度优化的模型库和推理优化器,专门提升大模型在昇腾硬件上的推理性能和易用性。MindIE LLM基于昇腾硬件,提供业界通用大模型推理能力,多并发请求的调度,包含Continuous Batching、PagedAttention、FlashDecoding等加速特性,使能用户高性能推理需求。

🔍 目录结构

 ├── mindie_llm                                     # Python 推理框架主模块
 │   ├── connector                                  # 请求接入层
 │   ├── text_generator                             # 核心推理引擎
 │   ├── modeling                                   # 模型封装抽象
 │   ├── runtime                                    # 运行时编译和模型加载
 │   ├── utils                                      # 工具模块:日志/张量/Profiling/验证等
 ├── examples                                       # 示例代码
 ├── docs                                           # 项目文档介绍
 ├── src                                            # C++ 核心引擎
 │   ├── engine                                     # LLM 引擎的主逻辑(调度/执行)
 │   ├── scheduler                                  # 调度器(FCFS/PDDS/Layerwise)
 │   ├── block_manager                              # KV Cache 块管理(LRU/Prefix Cache/CoW)
 │   ├── llm_manager                                # Python/C++ 桥接 API
 │   ├── server                                     # 服务端(gRPC/HTTP 接入端点)
 │   ├── utils                                      # 基础工具(共享内存/加密/日志/ID 生成等)
 │   ├── include                                    # 对外头文件接口
 ├── scripts                                        # 构建与部署脚本
 ├── tools                                          # 辅助工具
 ├── tests                                          # 测试
 ├── CMakeLists.txt                                 # CMake 构建配置
 ├── README.md

📢 版本说明

MindIE 软件版本       CANN 版本兼容性      
2.3.0 8.5.0

⚡️ 环境部署

  • 通过软件包或镜像方式安装MindIE LLM,请参见安装指南
  • 通过拉取最新代码编译安装MindIE LLM,请参见编译安装指南

⚡️ 快速入门

快速体验使用MindIE进行大模型推理的全流程,请参见快速入门

📝 学习文档

📝贡献声明

  1. 提交错误报告:如果您在MindIE LLM中发现了一个不存在安全问题的漏洞,请在MindIE LLm仓库中的Issues搜索,以防该漏洞被重复提交,如果找不到漏洞可以创建一个新的Issues。如果发现了一个安全问题请不要将其公开,请参阅安全问题处理方式。提交错误报告时应包含完整信息。
  2. 安全问题处理:本项目中对安全问题处理的形式,请通过邮箱通知项目核心人员确认编辑。
  3. 解决现有问题:通过查看仓库的Issues列表可以发现需要处理的问题信息,可以尝试解决其中的某个问题。
  4. 如何提出新功能:请使用Issues的Feature标签进行标记,我们会定期处理和确认开发。
  5. 开始贡献:
    a. Fork本项目的仓库。
    b. Clone到本地。
    c. 创建开发分支。
    d. 本地自测,提交前请通过所有的单元测试,包括为您要解决的问题新增的单元测试。
    e. 提交代码。
    f. 新建Pull Request。
    g. 代码检视,您需要根据评审意见修改代码,并重新提交更新。此流程可能涉及多轮迭代。
    h. 当您的PR获取足够数量的检视者批准后,Committer会进行最终审核。
    i. 审核和测试通过后,CI会将您的PR合并入到项目的主干分支。

更多贡献相关文档请参见贡献指南

📝免责声明

版权所有© 2025-2026 MindIE Project.

您对 "本文档" 的复制、使用、修改及分发受知识共享(Creative Commons,CC)署名 —— 相同方式共享 4.0 国际公共许可协议(以下简称 "CC BY-SA 4.0")的约束。为了方便用户理解,您可以通过访问 https://creativecommons.org/licenses/by-sa/4.0/ 了解 CC BY-SA 4.0 的概要(但不是替代)。关于 CC BY-SA 4.0 的完整协议内容,您可以访问如下网址获取:https://creativecommons.org/licenses/by-sa/4.0/legalcode

🌟 相关信息

项目介绍

昇腾自研大模型推理引擎

定制我的领域