README.md

runtime SIG

Runtime SIG专注于 CANN 生态中运行时的设计、开发、维护与性能优化。我们致力于构建一个高性能、可扩展、开放且面向未来的 AI 运行时系统,帮助 Ascend 生态向更通用、更可扩展、更友好的方向演进。

Runtime 是连接算子编译、图执行、调度器、通信库与NPU硬件的核心基础设施,是整个CANN软件栈中性能、稳定性与可用性最关键的组件之一。

在未来的生态中,我们希望CANN运行时不仅仅服务于框架和模型,更能成为产业级AI计算的统一执行底座。

工作目标(Goals)

  • 开放并规范运行时API

    使其适合 PyTorch、TensorFlow、MindSpore 以及未来的统一编程框架使用。

  • 提升运行时的性能与确定性

    Kernel高效下发和调度执行

    流调度更高效和可控

    更高的异步执行效率和加速器间的高效同步

    基于device CPU创新的调度机制

  • 增强多设备、多机通信能力

    P2P、零拷贝、共享内存等跨设备机制进一步开放

    Runtime 与 HCCL/SHMEM 的深度协同

  • 全面完善错误体系、可观测性、调试能力

    包含 Trace、Profiler、Dump、资源快照等。

工作愿景(Vision)

构建一个开放、透明、协作友好的CANN运行时社区,共同推进 AI 加速体系的基础设施革新。

推动Stream调度、任务调度、内存、事件、通信、集群执行等能力全面对齐国际主流架构,如 CUDA Runtime、ROCm Runtime,同时保留 Ascend 自身优势。

我们正在寻找热爱底层技术、对高性能计算与系统软件充满激情的开发者、架构师与研究者。 如果你想:

  • 参与构建全球领先的 NPU Runtime
  • 设计底层 API、调度系统、内存模型
  • 优化 AICore、DMA、HCCS 的性能潜力
  • 推动开源社区的技术方向
  • 在真实的高性能 AI 体系中贡献关键代码

那么 Runtime SIG 将是最适合你的地方。让我们一起打造 开放、强大、可持续的 AI 运行时基础设施!

成员

Maintainer列表

Committer列表

runtime

维测功能组件

社区运作

会议组织

  • 公开的会议时间:北京时间,两周一次例会,单周(每月第一、第三周,节假日跳过)周四下午14:00-16:00
  • 议题申报

会议纪要

SIG订阅

仓库清单

仓库地址: