文件最后提交记录最后更新时间
update: 更新ge sig committer17 天前
update ge-sig info5 个月前
committer下线16 小时前
README.md

ge SIG

概述

GE SIG 是 CANN 图模式研发的技术兴趣小组,聚焦于图编译器与图执行引擎的设计、演进与工程实践。 我们致力于打造开放、易用、性能领先的图编译基础设施,并持续推动其与主流 AI 框架和开源生态的深度融合,使开发者能够在昇腾 NPU 上获得稳定、高效、可持续演进的图模式体验。

工作目标

  • 推动图编译与图执行相关技术路线的讨论、沉淀与演进。
  • 通过例会、设计评审与技术分享,形成可复用的设计共识与最佳实践。
  • 维护 SIG 范围内核心仓库的 Issue、Bug 与用户反馈,保障社区的响应效率与工程质量。

职责范围与核心仓库

本SIG 主要负责以下几个核心仓库的开发与维护:

  • ge

    • 定位:GE 是图编译与运行的控制中心,负责计算图的编译、优化与执行调度,是昇腾图模式的核心引擎。
    • 功能:提供图编译与图执行能力,支持静态 / 动态 shape,包含图融合优化、内存与资源管理、下沉调度等关键机制,并通过统一的 Graph API 支撑用户自主构图与运行。
  • metadef

    • 定位:昇腾图与算子相关的元数据定义仓库,提供跨组件共享的数据结构与接口规范。
    • 功能:提供算子与图共用的基础数据结构与接口,支持 eager 模式与图模式的统一调用。
  • graph-autofusion

    • 定位:面向昇腾 NPU 的轻量级、解耦式自动融合组件集合,聚焦通过自动融合提升模型执行效率。
    • 功能:基于 codegen 的 JIT 编译机制实现高效融合与加速,目前已开源 SuperKernel 组件,后续将逐步开放更多融合相关模块。
  • torchair

    • 定位:TorchAir(Torch Ascend Intermediate Representation)是 PyTorch 与 GE 之间的图模式桥接组件,使 PyTorch 用户能够在昇腾 NPU 上使用图模式进行推理。
    • 功能:TorchAir 基于 PyTorch Dynamo 机制工作,将 PyTorch FX 图转换为 GE 计算图,并提供 GE 图在昇腾 NPU 上的编译与执行能力。
  • triton-inference-server-ge-backend

    • 定位:Triton Inference Server 中面向昇腾 NPU 的 GE 推理后端。
    • 功能:通过 Triton Backend 接口,基于 GE 实现模型在昇腾 NPU 上的图编译与推理执行。

边界与协作

本SIG负责的GE仓在CANN架构中位置如下图所示:

alt text

成员

Maintainer列表

Committer列表

社区运作

会议组织

  • 公开的会议时间:北京时间,每两周一次例会,单周周五下午14:00-16:00
  • 议题申报

欢迎社区成员提交技术讨论、设计提案、问题反馈或经验分享等作为会议议题。

会议纪要

SIG订阅

仓库清单

仓库地址: