cann-robotfix: 非主线包补充 custom_op_runtime 并收束 Python runtime 生命周期

文件	最后提交记录	最后更新时间
args_refresh_add_custom	fix: 非主线包补充 custom_op_runtime 并收束 Python runtime 生命周期 Co-authored-by: du-hua1024<duhua2@huawei.com> # message auto-generated for no-merge-commit merge: !4035 merge op into develop fix: 非主线包补充 custom_op_runtime 并收束 Python runtime 生命周期 Created-by: du-hua1024 Commit-by: du-hua1024 Merged-by: cann-robot Description: # Pull Request ## 描述 - 非主线包安装列表补充 `custom_op_runtime`，确保 Python 自定义算子运行时组件随包交付。 - 样例 README 同步补充 `toolkit`/`ops` 包安装和环境变量设置前置条件，明确 run 包编译 Python 版本需与执行版本一致。 - 清理 `GeExecutor::Initialize()` 和 `GeGenerator::Initialize()` 中对进程级 Python runtime 的重复初始化/析构职责，避免 executor/generator 层额外持有 `EnsureReady()/ShutdownProcess()` guard。acl 离线运行支持python自定义算子场景后续分析。 - ATC 侧将 `GePythonRuntimeManager` 生命周期收束到 `api/atc/main_impl.cc::main_impl()`：raw options 加载成功后统一 `EnsureReady()`，并通过入口作用域 guard 在 ATC 退出时统一 `ShutdownProcess()`。 - ATC 子路径继续只负责各自资源：`PrepareOmGeneration()` / `GenerateSingleOp()` / `ConvertModelToJson()` 保留 custom op 加载或清理，`GenerateModel()` 保留 GELib 和 GeGenerator 的初始化/释放，不再分散管理 Python runtime。 GeGenerator::Initialize() 调用侧 GePythonRuntimeManager::EnsureReady() 覆盖链路说明 - ATC 总入口：`main_impl()` -> `LoadRawOptionsForAtc()` -> `GePythonRuntimeManager::Instance().EnsureReady()` -> 注册 `release_python_runtime` guard -> `CheckGlobalOptionsBeforeRun()` -> `RunAtcByMode(raw_options)`。因此 ATC 后续所有模式都处于同一个入口级 Python runtime 生命周期内。 - ACL graph build 初始化：`aclgrphBuildInitialize()` -> `EnsureReady()` + `LoadCustomOps()` + `LoadPassPlugins()`；后续 `aclgrphBuildModel()` / `aclgrphBundleBuildModel()` 进入 `Impl::BuildModel()` -> `Impl::Init()` -> `generator_.Initialize()`，依赖先 initialize 后 build 的接口生命周期契约。 - ACL 单算子本地编译：`aclopCompile()` / `aclopCompileAndExecute()` / `aclopCompileAndExecuteV2()` / `aclGenGraphAndDumpForOp()` -> `OpCompileProcessor::GetInstance()` -> `OpCompileProcessor::Init()` -> `SetOption()` -> `OpCompileService::SetCompileStrategy(NATIVE_COMPILER)` -> `LocalCompiler::CreateCompiler()` -> `LocalCompiler::Init()` -> `GEInitialize()` -> `GEInitializeV2()` -> `EnsureReady()` + `LoadCustomOps()`；之后 cache miss 或 dump 图路径再进入 `LocalCompiler::OnlineCompileAndDump()` -> `GeGenerator::Initialize()`。 ## 变更类型请选择本次引入的变更类型（勾选对应项）： - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新（格式化，局部变量） - [x] ♻️ 重构（既不修复错误也不增加功能的代码变动） - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue 无。 ## 如何测试历史用例通过，python自定义算子example正常运行 ## 核对清单 - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签（如：`feat:`, `fix:`） - [x] 我已经详细阅读了贡献指南（CONTRIBUTING.md），并遵守了其中的所有规定，包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 See merge request: cann/ge!4035	6 天前
ascendc_add_custom	fix: 修复precommit误删的py引用 Co-authored-by: yelongjian<yelongjian1@huawei.com> # message auto-generated for no-merge-commit merge: !3885 merge dev-precommit0706 into develop fix: 修复precommit误删的py引用 Created-by: yelongjian Commit-by: yelongjian Merged-by: cann-robot Description: # Pull Request ## 描述修复precommit误删的py引用 ## 变更类型请选择本次引入的变更类型： <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新（格式化，局部变量） - [ ] ♻️ 重构（既不修复错误也不增加功能的代码变动） - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在当前页面的右侧'关联Issue'部分添加相应Issue链接，并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试描述测试此变更的步骤和前提条件： 1.NA ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签（如：`feat:`, `fix:`） - [x] 我已经详细阅读了贡献指南（CONTRIBUTING.md），并遵守了其中的所有规定，包括但不限于commit message的格式、无效commit的合并等 ## 其他信息在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!3885	16 天前
compilable_add_custom	fix: 修复sample问题 Co-authored-by: Ekoxier<husizhe@huawei.com> # message auto-generated for no-merge-commit merge: !3937 merge fix/sample_issue into develop fix: 修复sample问题 Created-by: Ekoxier Commit-by: Ekoxier Merged-by: cann-robot Description: # Pull Request ## 描述 fix: 修复sample问题 ## 变更类型请选择本次引入的变更类型： <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新（格式化，局部变量） - [ ] ♻️ 重构（既不修复错误也不增加功能的代码变动） - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在当前页面的右侧'关联Issue'部分添加相应Issue链接，并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试描述测试此变更的步骤和前提条件： 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签（如：`feat:`, `fix:`） - [x] 我已经详细阅读了贡献指南（CONTRIBUTING.md），并遵守了其中的所有规定，包括但不限于commit message的格式、无效commit的合并等 ## 其他信息在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!3937	9 天前
data_dependent_shape_custom	fix: precommit整改 Co-authored-by: yelongjian<yelongjian1@huawei.com> # message auto-generated for no-merge-commit merge: !3726 merge dev-precommit into develop fix: precommit整改 Created-by: yelongjian Commit-by: yelongjian Merged-by: cann-robot Description: # Pull Request ## 描述 precommit整改 ## 变更类型请选择本次引入的变更类型： <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [x] 💄 代码风格更新（格式化，局部变量） - [ ] ♻️ 重构（既不修复错误也不增加功能的代码变动） - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在当前页面的右侧'关联Issue'部分添加相应Issue链接，并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试描述测试此变更的步骤和前提条件： 1.NA ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签（如：`feat:`, `fix:`） - [x] 我已经详细阅读了贡献指南（CONTRIBUTING.md），并遵守了其中的所有规定，包括但不限于commit message的格式、无效commit的合并等 ## 其他信息在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!3726	26 天前
triton_add_custom	fix: 修复precommit误删的py引用 Co-authored-by: yelongjian<yelongjian1@huawei.com> # message auto-generated for no-merge-commit merge: !3885 merge dev-precommit0706 into develop fix: 修复precommit误删的py引用 Created-by: yelongjian Commit-by: yelongjian Merged-by: cann-robot Description: # Pull Request ## 描述修复precommit误删的py引用 ## 变更类型请选择本次引入的变更类型： <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新（格式化，局部变量） - [ ] ♻️ 重构（既不修复错误也不增加功能的代码变动） - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在当前页面的右侧'关联Issue'部分添加相应Issue链接，并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试描述测试此变更的步骤和前提条件： 1.NA ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签（如：`feat:`, `fix:`） - [x] 我已经详细阅读了贡献指南（CONTRIBUTING.md），并遵守了其中的所有规定，包括但不限于commit message的格式、无效commit的合并等 ## 其他信息在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!3885	16 天前
README.md	feat: 新增 Python 自定义算子样例及文档 Co-authored-by: du-hua1024<duhua2@huawei.com> # message auto-generated for no-merge-commit merge: !3989 merge op into develop feat: 新增 Python 自定义算子样例及文档 Created-by: du-hua1024 Commit-by: du-hua1024 Merged-by: cann-robot Description: # Pull Request ## 描述在 `args_refresh_add_custom` 路径下新增 Python 版本样例，展示通过 Python `EagerExecuteOp` 在 GE 在线执行中加载 Bisheng 预编译产物，并使用 ACL Python runtime 完成 kernel 参数构造和下发。主要变更： - 将原 `args_refresh_add_custom` C++ 样例整理到 `cpp/` 目录，保持原 ArgsUpdater 对比样例能力。 - 新增 `python/` 样例，包括 `REG_OP` proto、ES wheel 生成、`run.sh`、Python custom op 实现和 `Session.run_graph` 入口。 - Python 样例通过 `bisheng` 编译 host object，并提取 `.aicore_binary` 后由 `acl.rt.binary_load_from_file` 加载。 - 更新 custom op 示例总览和 GE Python custom op 设计文档。 ## 变更类型请选择本次引入的变更类型： <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新（格式化，局部变量） - [x] ♻️ 重构（既不修复错误也不增加功能的代码变动） - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue 无 ## 如何测试 - `bash -n examples/custom_op/args_refresh_add_custom/python/run.sh` ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签（如：`feat:`, `fix:`） - [x] 我已经详细阅读了贡献指南（CONTRIBUTING.md），并遵守了其中的所有规定，包括但不限于commit message的格式、无效commit的合并等 ## 其他信息无 See merge request: cann/ge!3989	8 天前
README_en.md	feat: 新增 Python 自定义算子样例及文档 Co-authored-by: du-hua1024<duhua2@huawei.com> # message auto-generated for no-merge-commit merge: !3989 merge op into develop feat: 新增 Python 自定义算子样例及文档 Created-by: du-hua1024 Commit-by: du-hua1024 Merged-by: cann-robot Description: # Pull Request ## 描述在 `args_refresh_add_custom` 路径下新增 Python 版本样例，展示通过 Python `EagerExecuteOp` 在 GE 在线执行中加载 Bisheng 预编译产物，并使用 ACL Python runtime 完成 kernel 参数构造和下发。主要变更： - 将原 `args_refresh_add_custom` C++ 样例整理到 `cpp/` 目录，保持原 ArgsUpdater 对比样例能力。 - 新增 `python/` 样例，包括 `REG_OP` proto、ES wheel 生成、`run.sh`、Python custom op 实现和 `Session.run_graph` 入口。 - Python 样例通过 `bisheng` 编译 host object，并提取 `.aicore_binary` 后由 `acl.rt.binary_load_from_file` 加载。 - 更新 custom op 示例总览和 GE Python custom op 设计文档。 ## 变更类型请选择本次引入的变更类型： <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新（格式化，局部变量） - [x] ♻️ 重构（既不修复错误也不增加功能的代码变动） - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue 无 ## 如何测试 - `bash -n examples/custom_op/args_refresh_add_custom/python/run.sh` ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签（如：`feat:`, `fix:`） - [x] 我已经详细阅读了贡献指南（CONTRIBUTING.md），并遵守了其中的所有规定，包括但不限于commit message的格式、无效commit的合并等 ## 其他信息无 See merge request: cann/ge!3989	8 天前

自定义算子入图样例

本目录提供自定义算子入图相关样例，覆盖不同构图入口、算子编成语言和模型下沉链路。

样例总览

样例	场景	构图入口	算子编成语言	算子编译方式	模型下沉能力	链接
`ascendc_add_custom`	Ascend C 算子通过 GE 入图	PyTorch + TorchAir	Ascend C	CMake编译	不涉及	README
`triton_add_custom`	Triton 算子通过 GE 入图	TensorFlow	Triton	预编译为 `npubin`	不涉及	README
`compilable_add_custom`	Ascend C 算子通过 GE 入图并生成 om离线模型	GE + ATC离线编译	Ascend C	RTC算子运行时编译	支持模型下沉到 om离线模型	README
`data_dependent_shape_custom`	数据依赖 shape 算子	GE	Ascend C	CMake编译	不涉及	README
`args_refresh_add_custom`	ArgsUpdater 地址刷新 + MallocReadOnlyDevArgs + 性能对比	GE 在线执行	Ascend C	RTC 运行时编译	在线地址刷新性能对比	README
`args_refresh_add_custom（Python 版本）`	Python EagerExecuteOp 执行	GE 在线执行	Ascend C	Bisheng 预编译	不涉及	README

通用开发流程

1. 编写自定义算子交付件

自定义算子交付件通常是一个可被 GE / 框架插件加载的 .so，核心是实现 inc/graph_metadef/external/graph/custom_op.h 中的能力接口，并通过 REG_AUTO_MAPPING_OP 注册。 GE 原生构图场景还需要提供 REG_OP proto 头文件，描述算子的输入、输出和属性，供构图侧创建 op type 时使用。

当前提供接口功能用途：

接口 / 宏	用途
`class BaseCustomOp`	自定义算子能力接口的公共基类，用户实现类按需组合继承其他能力接口。
`class EagerExecuteOp`	运行时执行能力，可获取输入 Tensor、申请输出 Tensor、申请 workspace 并发起 kernel 调用。
`class ShapeInferOp`	Shape / DataType 推导能力，用于在编译或构图阶段设置输出描述。
`class CompilableOp`	在线编译能力，适合在 GE/ATC 编译过程中读取输入元信息、编译 kernel 或准备编译产物。
`class PortableOp`	序列化 / 反序列化能力，用于在 OM 保存和加载阶段序列化 / 反序列化自定义算子kernel bin。
`REG_OP`	定义 GE 原生构图可见的算子 proto，通常随交付件复制到 `op_graph/include/`。
`REG_AUTO_MAPPING_OP`	静态注册自定义算子类型和创建宏，GE 按算子类型创建对应实现类。

接口组合按场景选择：

场景	推荐实现
动态图在线执行	`EagerExecuteOp` + `ShapeInferOp(可选)`
动态图在线执行 + 算子在线编译	`EagerExecuteOp` + `CompilableOp` + `ShapeInferOp(可选)`
静态图离线下沉OM模型执行 + 算子在线编译	`EagerExecuteOp` + `CompilableOp` + `ShapeInferOp(可选)` + `PortableOp`
地址刷新 + 在线执行	`EagerExecuteOp` + `ArgsUpdater` + `ShapeInferOp`

交付件命名可以按样例自行选择，但需要保证算子类型、注册类名和构图侧使用的 op type 对齐。

2. 配置交付件路径

自定义算子交付件需要通过 ASCEND_CUSTOM_OPP_PATH 暴露给 GE / ATC / 框架插件。推荐按 OPP 包根目录组织：

<custom_opp_root>/
├── op_graph
│   ├── include
│   │   └── xxx_custom.h
│   └── lib
│       └── <os>
│           └── <arch>
│               └── libxxx_custom_op.so
└── framework
    └── tensorflow
        └── npu_supported_ops.json  // Tensorflow入图时需要

GE构图配置方式：

export ASCEND_CUSTOM_OPP_PATH="<custom_opp_root>:$ASCEND_CUSTOM_OPP_PATH"

<os>/<arch> 按运行环境选择，例如 linux/x86_64、linux/aarch64。离线保存 OM 时，如果模型需要携带自定义算子 so，GE会基于运行环境读取 <custom_opp_root>/op_graph/lib/<os>/<arch>/ 下的 .so 交付件。

3. 构图和前端接入

GE 原生构图时，构图侧需要能看到 REG_OP proto 头文件，并在图中创建与 REG_AUTO_MAPPING_OP 注册名一致的 op type。参考 compilable_add_custom 和 data_dependent_shape_custom。

PyTorch / TorchAir 入图时，除了 GE 侧自定义算子 .so，还需要 Python / PyTorch 侧的注册和转换逻辑：

前端	额外交付件 / 配置
PyTorch + TorchAir	需要 `TORCH_LIBRARY` / `TORCH_LIBRARY_IMPL` 注册 Python 可见算子，并通过 TorchAir converter 将 PyTorch 节点映射到 GE 自定义算子。
TensorFlow	需要 TensorFlow 侧自定义算子 `.so`，并提供框架插件可识别的 `npu_supported_ops.json`；TensorFlow Adapter 处理构图后会带入 GE 侧 `REG_OP` 信息。

不同前端的“入图”职责不同，但最终都需要让 GE 图里的 op type 能映射到自定义算子实现类。

4. 编译和运行

常见运行方式：

方式	说明	接口要求
在线 / 直接执行	进程内构图后直接执行，或框架图模式运行时执行。	通常需要 `EagerExecuteOp`，并按需实现 `ShapeInferOp`。
离线 OM	构图后经 ATC 生成离线OM模型，再由 ACL 加载执行。	需要 `PortableOp` 将编译产物序列化进 OM，并在执行阶段反序列化恢复。

如果只是框架在线图模式执行，可以不实现 PortableOp。如果目标是 AIR -> ATC -> OM -> ACL 的离线模型链路，则需要考虑编译产物如何随模型保存和恢复。

5. 开发检查项

算子类型名、注册类名、构图侧 op type 保持一致。
kernel bin、源码来源明确，路径不要依赖临时工作目录。
ASCEND_CUSTOM_OPP_PATH 指向 OPP 包根目录，而不是随意指向某个 .so 所在目录，除非对应 sample 明确采用简化目录。
TensorFlow / PyTorch 入图场景同时检查框架侧交付件和 GE 侧交付件是否都已加载。