ge:基于昇腾的图编译器和执行器项目

GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。

分支9Tags7
文件最后提交记录最后更新时间
feat: 扩展TensorMove消除场景(特殊源节点 + 多TM消费 + 读写/排布冲突检查) Co-authored-by: stevenaw0<huangguijun@huawei.com> # message auto-generated for no-merge-commit merge: !2908 merge tm_delete_optimize2 into develop feat: 扩展TensorMove消除场景(特殊源节点 + 多TM消费 + 读写/排布冲突检查) Created-by: stevenaw0 Commit-by: stevenaw0 Merged-by: cann-robot Description: # Pull Request ## 描述 扩展现有 TensorMoveDeletePass,新增两种 TensorMove 消除场景: 1. **场景一**:variable/const 等特殊源节点下的 TensorMove,当后继不覆写源内存时允许消除 2. **场景二**:源节点输出被多个 TensorMove 消费时,将兄弟 TM 视为只读消费者,允许逐 TM 决策消除 同时新增两道安全关卡: - **Rule 4 (读写冲突检查)**:调用 mem_rw_conflict_optimize 新增接口,删除 TM 前判断是否导致读写冲突 - **Rule 5 (内存排布冲突检查)**:调用 mem_layout_conflict_util 新增接口,删除 TM 前判断是否导致内存排布冲突 ## 变更类型 - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新 - [ ] ♻️ 重构 - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue 无 ## 修改文件 | 文件 | 改动 | |------|------| | compiler/graph/optimize/mem_rw_conflict_optimize.h | 新建 | | compiler/graph/optimize/mem_rw_conflict_optimize.cc | +41行 | | compiler/graph/optimize/mem_layout_conflict_optimize/mem_layout_conflict_util.h | +4行 | | compiler/graph/optimize/mem_layout_conflict_optimize/mem_layout_conflict_util.cc | +132行 | | compiler/graph/manager/graph_manager.cc | +2行 | | compiler/graph/passes/standard_optimize/tensor_move_delete_pass.cc | +93/-4行 | | tests/ge/ut/ge/graph/passes/tensor_move_delete_pass_unittest.cc | +151行 | ## 核对清单 - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签 - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md) ## 其他信息 详细设计文档见 docs/superpowers/specs/2026-05-15-tensormove-optimize2-design.md See merge request: cann/ge!29088 天前
fix: 子流水线支持更新门禁代码 Co-authored-by: 叶龙剑<yelongjian1@huawei.com> # message auto-generated for no-merge-commit merge: !2435 merge master-test0429 into master fix: 子流水线支持更新门禁代码 Created-by: yelongjian Commit-by: 叶龙剑 Merged-by: cann-robot Description: # Pull Request ## 描述 子流水线支持更新门禁代码 当门禁包含子流水线时,如果没有这个配置,会导致子流水线中任务无法更新最新代码,使用落后的代码跑门禁 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.NA ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!24351 个月前
feat: 新增gitcode-pipeline skill及修复skill安装软链接问题 Co-authored-by: stevenaw0<huangguijun@huawei.com> # message auto-generated for no-merge-commit merge: !2663 merge add_gp2 into develop feat: 新增gitcode-pipeline skill及修复skill安装软链接问题 Created-by: stevenaw0 Commit-by: stevenaw0 Merged-by: cann-robot Description: # Pull Request ## 描述 1. 新增 gitcode-pipeline skill,支持触发CI、查询流水线状态、获取失败任务日志 2. 修复当 .claude/skills 目录下已存在实体目录时,软链接会建立在实体目录下的问题 3. 更新 README 文档,补充 gitcode-pipeline skill 说明 4. 更新 opencode.json 权限配置,添加 /tmp、~/Ascend、/usr/local/Ascend 目录 5. 更新 AGENTS.md,移除冗余的环境要求章节,补充 ci 操作说明 ## 变更类型 请选择本次引入的变更类型(勾选对应项): - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 如何测试 1. 验证 gitcode-pipeline skill 安装:运行 install-default-skills.sh,确认 gitcode-pipeline 被正确安装 2. 验证软链接修复:在 .claude/skills 目录下预创建同名目录,运行安装脚本确认软链接正确创建 3. 验证 pipeline 功能:触发一个 PR 的 CI 流水线并查询状态 ## 核对清单 - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md) ## 其他信息 本次变更涉及两个 commit,第一个添加 gitcode-pipeline skill,第二个修复安装脚本中的软链接问题。 See merge request: cann/ge!266325 天前
【fix】: fix compileGraph in jit mode lose hintshape option Co-authored-by: chengyutao3<chengyutao3@huawei.com> # message auto-generated for no-merge-commit merge: !3239 merge develop into develop 【fix】: fix compileGraph in jit mode lose hintshape option Created-by: chengyutao3 Commit-by: chengyutao3 Merged-by: cann-robot Description: # Pull Request ## 描述 fix compileGraph in jit mode lose hintshape option merge to master ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!32391 天前
fix: 更新JSON配置文件解析错误信息,增加缺失字段提示 Co-authored-by: Chang-an-HW<machangan@huawei.com> # message auto-generated for no-merge-commit merge: !3287 merge fix_hccl_config_error_log into develop fix: 更新JSON配置文件解析错误信息,增加缺失字段提示 Created-by: Chang-an-HW Commit-by: Chang-an-HW Merged-by: cann-robot Description: # Pull Request ## 描述 fix: 更新JSON配置文件解析错误信息,增加缺失字段提示 fix: 修复ReadElfMachine函数中machine_bytes数组大小定义错误 fix: 将多个函数声明中的缺失const修饰符添加到GeRootModel和ModelHelper类的方法中 fix: 添加GetRealFilePath函数以验证文件路径并更新相关调用 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. atc验证hccl配置文件格式错误的场景 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!32871 天前
【chore】: 支持Q2工程优化: 解耦 'add_cann_third_party(grpc)' 和 'find_package(gRPC CONFIG REQUIRED)' Co-authored-by: zhuhaoran5<zhuhaoran5@huawei.com> # message auto-generated for no-merge-commit merge: !3296 merge support_Q2_building_optimization_dev into develop 【chore】: 支持Q2工程优化 Created-by: zhuhaoran5 Commit-by: zhuhaoran5 Merged-by: cann-robot Description: # Pull Request ## 描述 【chore】: 支持Q2工程优化: 解耦 'add_cann_third_party(grpc)' 和 'find_package(gRPC CONFIG REQUIRED)' ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [x] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [x] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 按照 README 部署构建环境 执行所有构建场景的脚本命令,能执行成功并且产物包内容与先前一致 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [ ] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!32961 天前
!3307 merge develop into master 【PR】: sync develop to master 0601 Created-by: yangyongqiang0606 Commit-by: lushiming0;hugo111;Chang-an-HW;kobemini;tangqunzhang;zhuhaoran5;ClarkXie;yuht9;chengyutao3;zhangfeifan0709;yelongjian;Ekoxier Merged-by: cann-robot Description: # Pull Request ## 描述 1. 修复自定义算子Compile多次编译问题 2. fix te user config error E40022 log 3. Fix CodeCheck 4. 修改readme描述信息 5. 日志与readme统一 6. fix compileGraph in jit mode lose hintshape option 7. 自定义算子入图支持地址刷新 8. OM2消除rts_kernel.h 9. 支持Q2工程优化 10. 删除ge_rts_decl.h重复定义 11. es创建netoutput不再创建输出tensordesc 12. JSON配置解析错误增加缺失字段提示 13. fix成环检测并发问题 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!330718 小时前
refactor: 清理各模块CMakeLists.txt中硬编码的ASCEND_INSTALL_PATH路径依赖 Co-authored-by: yitaoxt<yitaoxt@qq.com> # message auto-generated for no-merge-commit merge: !3251 merge feat_13_p2 into develop refactor: 清理各模块CMakeLists.txt中硬编码的ASCEND_INSTALL_PATH路径依赖 Created-by: yitaoxt Commit-by: yitaoxt Merged-by: cann-robot Description: 将各模块CMakeLists.txt中对ASCEND_INSTALL_PATH的直接引用替换为已有的INTERFACE target链接(runtime_headers、hccl_headers、slog_headers、adump_headers、metadef_headers等),减少硬编码路径依赖。 涉及12个文件变更,减少50行硬编码路径引用。 测试:bash build.sh全量编译通过,三个run包成功生成。 See merge request: cann/ge!32511 天前
fix: es创建netoutput节点不再创建输出tensordesc Co-authored-by: kobemini<gengchao4@huawei.com> # message auto-generated for no-merge-commit merge: !3294 merge docs/fusion-pattern-pass-index into develop fix: es创建netoutput节点不再创建输出tensordesc Created-by: kobemini Commit-by: kobemini Merged-by: cann-robot Description: # Pull Request ## 描述 - 在 AGENTS.mddocs/architecture/README.md 补充 fusion_pattern_pass.md 文档入口。 - 调整 ES C GraphBuilder 创建 NetOutput 的行为:只保留动态输入 TensorDesc,不再创建输出 TensorDesc。 - 同步清理非 autofuse runtime stub 中依赖 NetOutput 输出 TensorDesc 的设置。 - 调整 Python node_test,普通输出属性和输出数量测试改用 Add 节点,避免继续假设 NetOutput 存在输出 TensorDesc。 ## 变更类型 请选择本次引入的变更类型(勾选对应项): - [x] Bug 修复 - [ ] 新功能 - [ ] 代码风格更新(格式化,局部变量) - [ ] 重构(既不修复错误也不增加功能的代码变动) - [ ] 构建过程或辅助工具的变动 - [x] 文档内容更新 ## 关联的Issue 无 ## 如何测试 - git diff --check upstream/develop...HEAD - python3 -m py_compile tests/ge/ut/ge/graph/pyge_tests/node_test.py - python3 -m pytest tests/ge/ut/ge/graph/pyge_tests/node_test.py -q - 静态搜索确认本次 PR 不再修改 autofuse ESB helper,ES C GraphBuilder 不再注册 NetOutput 动态输出。 ## 核对清单 - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md) ## 其他信息 目标分支:develop。 本次先收敛非 autofuse 场景,暂不调整 tests/autofuse/framework/eager_style_graph_builder/esb_graph.cpp。 See merge request: cann/ge!32941 天前
【doc】: 2_fuse_matmul_add_pass_with_capture_tensor中日志与readme统一 Co-authored-by: zhangfeifan0709<zhangfeifan7@huawei.com> # message auto-generated for no-merge-commit merge: !3283 merge develop_md61 into develop 【doc】: 2_fuse_matmul_add_pass_with_capture_tensor中日志与readme统一 Created-by: zhangfeifan0709 Commit-by: zhangfeifan0709 Merged-by: cann-robot Description: # Pull Request ## 描述 2_fuse_matmul_add_pass_with_capture_tensor中日志与readme统一 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 不涉及 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!32831 天前
【feat】:自定义算子入图支持地址刷新 Co-authored-by: yuht9<yuhaitao6@huawei.com> # message auto-generated for no-merge-commit merge: !3270 merge develop into develop 【feat】:自定义算子入图支持地址刷新 Created-by: yuht9 Commit-by: yuht9 Merged-by: cann-robot Description: # Pull Request ## 描述 新增接口与数据结构: - ArgsHandler: args 内存管理抽象接口(VA 分配 + H2D 拷贝) - KernelArgs: kernel launch arguments 结构体,含 placement 信息 - UpdateArgsContext: 地址刷新上下文,继承自 EagerOpExecutionContext - ArgsUpdater: 自定义算子地址刷新能力接口,算子继承后框架在 I/O 地址变化时回调 UpdateHostArgs - SinkOpArgsHandler: SinkOp 场景下 ArgsHandler 实现,委托 CustomTaskInfo 完成分配 - ArgsAllocationResult: 分配结果描述,含 reserved/extra 来源信息 - TaskInfo 新增 NeedReserveArgsTable/UpdateHostArgs/GetArgsAllocationResults 虚接口 CustomTaskInfo 扩展: - 支持 ArgsUpdater 算子检测(IsAddressRefreshable)及地址刷新策略 - MallocReadOnlyDevArgsImpl 双路径分配:reserved 段(支持刷新)/ 动态内存(H2D 直拷) - UpdateHostArgs 实现 I/O 地址更新及算子回调 - InitArgsIoAddrsUpdater 初始化地址映射关系 ModelArgsManager 扩展: - 三级内存分配:reserved segment -> existing extra pool -> new extra pool - IntegrateCustomOpArgs 将自定义算子 args 集成到统一刷新流程 - IntegrateReservedH2DCopyDatas/IntegrateExtraH2DCopyDatas 注册 H2D 刷新数据 - IntegrateReservedUpdateDatas/IntegrateExtraUpdateDatas 注册 host args 刷新数据 - UpdateCustomOpHostArgs/RefreshExtraH2DCopyDatas 执行阶段触发刷新 - custom_op_policies_to_task_infos_ 使用 unordered_set 保证去重 编译器适配: - block_mem_assigner: 自定义算子支持零拷贝(IsAddressRefreshable 动态判断) - mem_layout_conflict_util: 自定义算子支持地址刷新 CustomOpFactory 扩展: - IsAddressRefreshable: 通过 dynamic_cast 判断算子是否支持地址刷新 UT/ST 用例: - SinkOpArgsHandler/CustomTaskInfo/ModelArgsManager/ArgsIoAddrsUpdater/UpdateArgsContext/DavinciModel 单元测试 - 自定义算子地址刷新端到端 ST 用例及 CustomTaskInfo 地址刷新模式验证 - reserved+extra 去重验证、多个 ArgsUpdater 并发刷新测试 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.构造自定算子连接模型边界场景,算子实现UpdateHostArgs函数,模型执行精度正确。 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 20260423评审通过 See merge request: cann/ge!32701 天前
fix: 更新JSON配置文件解析错误信息,增加缺失字段提示 Co-authored-by: Chang-an-HW<machangan@huawei.com> # message auto-generated for no-merge-commit merge: !3287 merge fix_hccl_config_error_log into develop fix: 更新JSON配置文件解析错误信息,增加缺失字段提示 Created-by: Chang-an-HW Commit-by: Chang-an-HW Merged-by: cann-robot Description: # Pull Request ## 描述 fix: 更新JSON配置文件解析错误信息,增加缺失字段提示 fix: 修复ReadElfMachine函数中machine_bytes数组大小定义错误 fix: 将多个函数声明中的缺失const修饰符添加到GeRootModel和ModelHelper类的方法中 fix: 添加GetRealFilePath函数以验证文件路径并更新相关调用 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. atc验证hccl配置文件格式错误的场景 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!32871 天前
refactor: 清理各模块CMakeLists.txt中硬编码的ASCEND_INSTALL_PATH路径依赖 Co-authored-by: yitaoxt<yitaoxt@qq.com> # message auto-generated for no-merge-commit merge: !3251 merge feat_13_p2 into develop refactor: 清理各模块CMakeLists.txt中硬编码的ASCEND_INSTALL_PATH路径依赖 Created-by: yitaoxt Commit-by: yitaoxt Merged-by: cann-robot Description: 将各模块CMakeLists.txt中对ASCEND_INSTALL_PATH的直接引用替换为已有的INTERFACE target链接(runtime_headers、hccl_headers、slog_headers、adump_headers、metadef_headers等),减少硬编码路径依赖。 涉及12个文件变更,减少50行硬编码路径引用。 测试:bash build.sh全量编译通过,三个run包成功生成。 See merge request: cann/ge!32511 天前
refactor: 删除ge_rts_decl.h中与rt_external重复的定义 Co-authored-by: tangqunzhang<tangqunzhang@huawei.com> # message auto-generated for no-merge-commit merge: !3303 merge refactor/remove-duplicate-rt-decls into develop refactor: 删除ge_rts_decl.h中与rt_external重复的定义 Created-by: tangqunzhang Commit-by: tangqunzhang Merged-by: cann-robot Description: # Pull Request ## 描述 删除ge_rts_decl.h中与rt_external头文件重复的定义,避免重复声明。 ## 变更内容 - 删除rtDevBinary_t结构体(已在rt_external_kernel.h中定义) - 删除rtDevBinaryRegister函数声明(已在rt_external_kernel.h中定义) - 删除rtRegisterAllKernel函数声明(已在rt_external_kernel.h中定义) - tbe_kernel_handle.h改为直接include runtime/rt.h ## 变更类型 - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新 - [x] ♻️ 重构 - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 核对清单 - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [ ] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签 See merge request: cann/ge!33031 天前
【feat】:自定义算子入图支持地址刷新 Co-authored-by: yuht9<yuhaitao6@huawei.com> # message auto-generated for no-merge-commit merge: !3270 merge develop into develop 【feat】:自定义算子入图支持地址刷新 Created-by: yuht9 Commit-by: yuht9 Merged-by: cann-robot Description: # Pull Request ## 描述 新增接口与数据结构: - ArgsHandler: args 内存管理抽象接口(VA 分配 + H2D 拷贝) - KernelArgs: kernel launch arguments 结构体,含 placement 信息 - UpdateArgsContext: 地址刷新上下文,继承自 EagerOpExecutionContext - ArgsUpdater: 自定义算子地址刷新能力接口,算子继承后框架在 I/O 地址变化时回调 UpdateHostArgs - SinkOpArgsHandler: SinkOp 场景下 ArgsHandler 实现,委托 CustomTaskInfo 完成分配 - ArgsAllocationResult: 分配结果描述,含 reserved/extra 来源信息 - TaskInfo 新增 NeedReserveArgsTable/UpdateHostArgs/GetArgsAllocationResults 虚接口 CustomTaskInfo 扩展: - 支持 ArgsUpdater 算子检测(IsAddressRefreshable)及地址刷新策略 - MallocReadOnlyDevArgsImpl 双路径分配:reserved 段(支持刷新)/ 动态内存(H2D 直拷) - UpdateHostArgs 实现 I/O 地址更新及算子回调 - InitArgsIoAddrsUpdater 初始化地址映射关系 ModelArgsManager 扩展: - 三级内存分配:reserved segment -> existing extra pool -> new extra pool - IntegrateCustomOpArgs 将自定义算子 args 集成到统一刷新流程 - IntegrateReservedH2DCopyDatas/IntegrateExtraH2DCopyDatas 注册 H2D 刷新数据 - IntegrateReservedUpdateDatas/IntegrateExtraUpdateDatas 注册 host args 刷新数据 - UpdateCustomOpHostArgs/RefreshExtraH2DCopyDatas 执行阶段触发刷新 - custom_op_policies_to_task_infos_ 使用 unordered_set 保证去重 编译器适配: - block_mem_assigner: 自定义算子支持零拷贝(IsAddressRefreshable 动态判断) - mem_layout_conflict_util: 自定义算子支持地址刷新 CustomOpFactory 扩展: - IsAddressRefreshable: 通过 dynamic_cast 判断算子是否支持地址刷新 UT/ST 用例: - SinkOpArgsHandler/CustomTaskInfo/ModelArgsManager/ArgsIoAddrsUpdater/UpdateArgsContext/DavinciModel 单元测试 - 自定义算子地址刷新端到端 ST 用例及 CustomTaskInfo 地址刷新模式验证 - reserved+extra 去重验证、多个 ArgsUpdater 并发刷新测试 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.构造自定算子连接模型边界场景,算子实现UpdateHostArgs函数,模型执行精度正确。 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 20260423评审通过 See merge request: cann/ge!32701 天前
【PR】: fix 成环检测并发问题 Co-authored-by: hugo111<zhaoxinxin1@huawei.com> # message auto-generated for no-merge-commit merge: !3171 merge fix_core into develop 【PR】: fix 成环检测并发问题 Created-by: hugo111 Commit-by: hugo111 Merged-by: cann-robot Description: # Pull Request ## 描述 消除静态变量,将成环检测调整为无状态检测,并在每个pass执行后在debug级别增加拓扑排序的定届手段。 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!31711 天前
sync develop to master 20260203 Co-authored-by: cann-robot<songchangxia@cann.team> Co-authored-by: Mexyy<xiaguozheng1@hisilicon.com> Co-authored-by: lining23666<lining.li@huawei.com> Co-authored-by: Chang-an-HW<machangan@huawei.com> Co-authored-by: yelongjian<yelongjian1@huawei.com> Co-authored-by: isaacxu<xurui23@huawei.com> Co-authored-by: zhang_shengjie<804425610@qq.com> Co-authored-by: jin-xiaohang<jinxiaohang4@huawei.com> Co-authored-by: kobemini<gengchao4@huawei.com> Co-authored-by: wang-bin-789<wangbin153@huawei.com> Co-authored-by: stevenaw0<huangguijun@huawei.com> Co-authored-by: yangzw653<yangzongwen1@huawei.com> Co-authored-by: jikai-tyler<jikai5@huawei.com> Co-authored-by: liuyuanchen1<liuyuanchen1@huawei.com> # message auto-generated for no-merge-commit merge: !395 merge develop into master sync develop to master 20260203 Created-by: depeng1994 Commit-by: zhang_shengjie;cann-robot;Mexyy;liuyuanchen1;jikai-tyler;yangzw653;stevenaw0;kobemini;wang-bin-789;yelongjian;jin-xiaohang;isaacxu;Chang-an-HW;lining23666 Merged-by: depeng1994 Description: # Pull Request ## 描述 develop分支整体合入同步到master,详细描述见提交记录。 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [ ] 我的代码遵循了项目的代码风格 - [ ] 我已对代码进行了自测 - [ ] 我已更新了相关的文档 - [ ] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [ ] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!3953 个月前
fix: 整改图片glf格式 Co-authored-by: 叶龙剑<yelongjian1@huawei.com> # message auto-generated for no-merge-commit merge: !2746 merge dev-test0512 into develop fix: 整改图片glf格式 Created-by: yelongjian Commit-by: 叶龙剑 Merged-by: cann-robot Description: # Pull Request ## 描述 整改图片glf格式 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.NA ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!274621 天前
feat: 扩展TensorMove消除场景(特殊源节点 + 多TM消费 + 读写/排布冲突检查) Co-authored-by: stevenaw0<huangguijun@huawei.com> # message auto-generated for no-merge-commit merge: !2908 merge tm_delete_optimize2 into develop feat: 扩展TensorMove消除场景(特殊源节点 + 多TM消费 + 读写/排布冲突检查) Created-by: stevenaw0 Commit-by: stevenaw0 Merged-by: cann-robot Description: # Pull Request ## 描述 扩展现有 TensorMoveDeletePass,新增两种 TensorMove 消除场景: 1. **场景一**:variable/const 等特殊源节点下的 TensorMove,当后继不覆写源内存时允许消除 2. **场景二**:源节点输出被多个 TensorMove 消费时,将兄弟 TM 视为只读消费者,允许逐 TM 决策消除 同时新增两道安全关卡: - **Rule 4 (读写冲突检查)**:调用 mem_rw_conflict_optimize 新增接口,删除 TM 前判断是否导致读写冲突 - **Rule 5 (内存排布冲突检查)**:调用 mem_layout_conflict_util 新增接口,删除 TM 前判断是否导致内存排布冲突 ## 变更类型 - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新 - [ ] ♻️ 重构 - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue 无 ## 修改文件 | 文件 | 改动 | |------|------| | compiler/graph/optimize/mem_rw_conflict_optimize.h | 新建 | | compiler/graph/optimize/mem_rw_conflict_optimize.cc | +41行 | | compiler/graph/optimize/mem_layout_conflict_optimize/mem_layout_conflict_util.h | +4行 | | compiler/graph/optimize/mem_layout_conflict_optimize/mem_layout_conflict_util.cc | +132行 | | compiler/graph/manager/graph_manager.cc | +2行 | | compiler/graph/passes/standard_optimize/tensor_move_delete_pass.cc | +93/-4行 | | tests/ge/ut/ge/graph/passes/tensor_move_delete_pass_unittest.cc | +151行 | ## 核对清单 - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签 - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md) ## 其他信息 详细设计文档见 docs/superpowers/specs/2026-05-15-tensormove-optimize2-design.md See merge request: cann/ge!29088 天前
feat:新增pre-commit功能 Co-authored-by: 叶龙剑<yelongjian1@huawei.com> # message auto-generated for no-merge-commit merge: !1652 merge dev-precommit0331 into develop feat:新增pre-commit功能 Created-by: yelongjian Commit-by: 叶龙剑 Merged-by: cann-robot Description: # Pull Request ## 描述 新增pre-commit功能 背景:工程前置校验功能更新,校验内容下沉到代码仓,支持在本地使用pre-commit插件进行检查 用途:本地下载pre-commit插件后,git commit的同时会触发校验,修改后上库可以提前在本地解决codecheck问题 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.NA ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!16521 个月前
fix: es创建netoutput节点不再创建输出tensordesc Co-authored-by: kobemini<gengchao4@huawei.com> # message auto-generated for no-merge-commit merge: !3294 merge docs/fusion-pattern-pass-index into develop fix: es创建netoutput节点不再创建输出tensordesc Created-by: kobemini Commit-by: kobemini Merged-by: cann-robot Description: # Pull Request ## 描述 - 在 AGENTS.mddocs/architecture/README.md 补充 fusion_pattern_pass.md 文档入口。 - 调整 ES C GraphBuilder 创建 NetOutput 的行为:只保留动态输入 TensorDesc,不再创建输出 TensorDesc。 - 同步清理非 autofuse runtime stub 中依赖 NetOutput 输出 TensorDesc 的设置。 - 调整 Python node_test,普通输出属性和输出数量测试改用 Add 节点,避免继续假设 NetOutput 存在输出 TensorDesc。 ## 变更类型 请选择本次引入的变更类型(勾选对应项): - [x] Bug 修复 - [ ] 新功能 - [ ] 代码风格更新(格式化,局部变量) - [ ] 重构(既不修复错误也不增加功能的代码变动) - [ ] 构建过程或辅助工具的变动 - [x] 文档内容更新 ## 关联的Issue 无 ## 如何测试 - git diff --check upstream/develop...HEAD - python3 -m py_compile tests/ge/ut/ge/graph/pyge_tests/node_test.py - python3 -m pytest tests/ge/ut/ge/graph/pyge_tests/node_test.py -q - 静态搜索确认本次 PR 不再修改 autofuse ESB helper,ES C GraphBuilder 不再注册 NetOutput 动态输出。 ## 核对清单 - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md) ## 其他信息 目标分支:develop。 本次先收敛非 autofuse 场景,暂不调整 tests/autofuse/framework/eager_style_graph_builder/esb_graph.cpp。 See merge request: cann/ge!32941 天前
feat: protobuf整改迁移公共仓 Co-authored-by: 叶龙剑<yelongjian1@huawei.com> # message auto-generated for no-merge-commit merge: !3234 merge dev-3rd0529 into develop feat: protobuf整改迁移公共仓 Created-by: yelongjian Commit-by: 叶龙剑 Merged-by: cann-robot Description: # Pull Request ## 描述 protobuf整改迁移公共仓 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.NA ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!32344 天前
【PR】: sync develop to master Co-authored-by: xiangrenzhi<xiangrenzhi@huawei.com> Co-authored-by: liyanrong_9<liyanrong9@h-partners.com> Co-authored-by: chenyukai<chenyukai4@huawei.com> Co-authored-by: lihuachao<lihuachao1@huawei.com> Co-authored-by: WangYanMale<wangyan220@huawei.com> Co-authored-by: xchu42<chuxing@huawei.com> Co-authored-by: yelongjian<yelongjian1@huawei.com> Co-authored-by: xingzhixiong<xingzhixiong@huawei.com> # message auto-generated for no-merge-commit merge: !1749 merge develop into master 【PR】: sync develop to master Created-by: wqtshg_wt Commit-by: liyanrong_9;xingzhixiong;yelongjian;xiangrenzhi;xchu42;chenyukai;WangYanMale;lihuachao Merged-by: cann-robot Description: # Pull Request ## 描述 1、使用rtGetSocSpec查询padding替换固定padding 2、新增AscIR(ArgMax) 3、remainder的语义修改为a-floor(a/b)*b 4、消除Broadcast造成concat_dim解析错误的问题 5、修改CONTRIBUTING.md拼写错误 6、【Fix】:修复溢出检测场景下,给adump设置OP_OVERFLOW类型的dump配置引入nnopbase溢出检测用例报错的问题 7、删除已经失效的编译参数说明 8、[feat] autofuse adds compile options parameter to jit_compile python interface. 9、LLT优化 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [x] ✨ 新功能 - [x] 💄 代码风格更新(格式化,局部变量) - [x] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [ ] 我的代码遵循了项目的代码风格 - [ ] 我已对代码进行了自测 - [ ] 我已更新了相关的文档 - [ ] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [ ] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!17491 个月前
Initial commit 5 个月前
【PR】: 规范化OAT.xml中许可证声明形式 Co-authored-by: chenyx2012<975102023@qq.com> # message auto-generated for no-merge-commit merge: !1666 merge master into master 【PR】: 规范化OAT.xml中许可证声明形式 Created-by: chenyx_2012 Commit-by: chenyx2012 Merged-by: cann-robot Description: # Pull Request ## 描述 规范化OAT.xml中许可证声明形式 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [ ] 我的代码遵循了项目的代码风格 - [ ] 我已对代码进行了自测 - [ ] 我已更新了相关的文档 - [ ] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [ ] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!16662 个月前
【PR】: 【更新文档】update TFA URL in README Co-authored-by: xiaguozheng<xiaguozheng1@hisilicon.com> # message auto-generated for no-merge-commit merge: !2165 merge f_20260422 into develop 【PR】: 【更新文档】update TFA URL in README Created-by: Mexyy Commit-by: xiaguozheng Merged-by: cann-robot Description: # Pull Request ## 描述 update TFA URL in README ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!21651 个月前
Initial commit 5 个月前
【PR】: add libseccomp to third party open source list Co-authored-by: lining23666<lining.li@huawei.com> # message auto-generated for no-merge-commit merge: !804 merge ln_0206 into develop 【PR】: add libseccomp to third party open source list Created-by: lining23666 Commit-by: lining23666 Merged-by: cann-robot Description: # Pull Request ## 描述 第三方开源软件列表中遗漏了libseccomp ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 不涉及功能修改 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!8042 个月前
【PR】: fix asan deadlock when fork 5 个月前
修改StatusFactory::Instance()非内联函数 18 天前
fix: 修改ge版本号 Co-authored-by: 叶龙剑<yelongjian1@huawei.com> # message auto-generated for no-merge-commit merge: !3062 merge dev-version0521 into develop fix: 修改ge版本号 Created-by: yelongjian Commit-by: 叶龙剑 Merged-by: cann-robot Description: # Pull Request ## 描述 修改ge版本号 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.NA ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!306211 天前
feat: 三方库迁移cmake仓-zlib&json&openssl Co-authored-by: 叶龙剑<yelongjian1@huawei.com> # message auto-generated for no-merge-commit merge: !2791 merge dev-third0509 into develop feat: 三方库迁移cmake仓-zlib&json&openssl Created-by: yelongjian Commit-by: 叶龙剑 Merged-by: cann-robot Description: # Pull Request ## 描述 三方库迁移cmake仓-zlib&json&openssl ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.NA ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [ ] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!279119 天前
Initial commit 5 个月前
add stub for graph 15 天前
【PR】: 简要描述 Co-authored-by: yajie_caroline<yajie_caroline@noreply.gitcode.com> Co-authored-by: lining23666<lining.li@huawei.com> # message auto-generated for no-merge-commit merge: !17 merge master into master 【PR】: 简要描述 Created-by: yajie_caroline Commit-by: yajie_caroline;lining23666 Merged-by: wqtshg_wt Description: # Pull Request ## 描述 请清晰准确地描述本次 Pull Request 的意图和变更内容。 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [ ] 我的代码遵循了项目的代码风格 - [ ] 我已对代码进行了自测 - [ ] 我已更新了相关的文档 - [ ] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [ ] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!172 个月前
fix: 修改ge版本号 Co-authored-by: 叶龙剑<yelongjian1@huawei.com> # message auto-generated for no-merge-commit merge: !3062 merge dev-version0521 into develop fix: 修改ge版本号 Created-by: yelongjian Commit-by: 叶龙剑 Merged-by: cann-robot Description: # Pull Request ## 描述 修改ge版本号 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.NA ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!306211 天前

GE(Graph Engine 图引擎)

🔥 Latest News

  • [2026/03] 持续增强图优化能力,完善单元测试覆盖,修复多个边缘场景的编译问题;优化文档结构,提升开发者体验。
  • [2026/02] 优化自动融合与广播场景支持,新增 BF16 数据类型支持;增强 HostCPU 引擎能力,优化 session 创建销毁锁机制;修复外置权重、线程加载等场景下的 bug;支持 Reduce 分核轴 Store 地址冲突惩罚,提升算子融合效果。
  • [2026/01] GE 项目首次上线,开源图编译器和执行器,支持 PyTorch、TensorFlow 前端接入以及 ONNX、PB 模型格式解析与编译。

🚀 概述

GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。详见昇腾社区文档-图模式开发指南

⚡️ 快速入门

若希望快速体验 GE 的工作方式及基本开发流程,可参考以下文档:

  • 构建验证:介绍组件的完整构建、测试样例运行流程。
  • 快速开始:以 ResNet50 模型为例,介绍如何使用 ATC 工具进行模型转换,并在昇腾 AI 处理器上执行推理。
  • 快速开始-LLM:以 Qwen 模型为例,介绍如何使用 ATC 工具进行LLM模型转换,并实现LLM模型的加载、执行和获取执行结果等。

📚 文档

如需了解如何使用 GE 进行模型编译与执行,可参见图模式开发指南、技术文章等内容: GE 参考资料

如果希望深入了解 GE 的内部设计、架构机制与开发流程,可参考以下文档:

  • GE 架构说明文档:介绍核心组件、执行流程、优化机制等内部原理。
  • 贡献指南:说明如何提交 Issue、Pull Request 以及代码规范。
  • AI Agent支持:介绍仓内默认使用的一些skills及使用agent辅助开发流程

🌐 生态集成

以下项目已集成 GE 作为推理或图模式后端:

  • TorchAir:将 GE 接入 PyTorch 图模式。链接
  • TFA(TensorFlow Adapter):将 GE 作为 TensorFlow 后端。链接
  • JittorInfer:基于昇腾芯片的大模型 C++ 推理框架。链接
  • Triton GE Backend:GE 的 Triton Inference Server 后端。链接

说明: 上述列表为已知并对外公开的集成案例,并非完整清单。 若您正在使用 GE,欢迎通过 Issue 或 PR 补充,我们将持续更新相关信息。

📝 其他信息

📝 联系我们

项目介绍

GE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新

语言类型

C++95.75%
Python1.42%
CMake1.17%
C1.05%
Shell0.54%