文件最后提交记录最后更新时间
【PR】: sync ge_dev to master 20260311 Co-authored-by: cann-robot<songchangxia@cann.team> Co-authored-by: tang-haojie<tanghaojie1@huawei.com> Co-authored-by: isaacxu<xurui23@huawei.com> Co-authored-by: yelongjian<yelongjian1@huawei.com> Co-authored-by: kobemini<gengchao4@huawei.com> Co-authored-by: yuchen97<wangyuchen38@huawei.com> Co-authored-by: maohaodi<maohaodi@huawei.com> Co-authored-by: lihuachao<lihuachao1@huawei.com> Co-authored-by: liuyuanchen1<liuyuanchen1@huawei.com> Co-authored-by: KenChow<zhouchen53@huawei.com> Co-authored-by: wtf_newage<liuqiang238@hisilicon.com> Co-authored-by: jin-xiaohang<jinxiaohang4@huawei.com> Co-authored-by: peiyang<lipeiyang@huawei.com> Co-authored-by: wangxiaotian995<710309755@qq.com> Co-authored-by: andy_git<liaomeifeng@huawei.com> Co-authored-by: zhangfeifan0709<zhangfeifan7@huawei.com> Co-authored-by: xuyafei<xuyafei3@huawei.com> Co-authored-by: lining23666<lining.li@huawei.com> Co-authored-by: zhang_shengjie<804425610@qq.com> Co-authored-by: jinhu_huawei<jinhu5@huawei.com> Co-authored-by: wuzhengzhen<wuzhengzhen@huawei.com> Co-authored-by: chenyukai<chenyukai4@huawei.com> Co-authored-by: jiang-mingming01<jiangmingming16@h-partners.com> # message auto-generated for no-merge-commit merge: !1045 merge develop into master 【PR】: sync ge_dev to master 20260311 Created-by: peiyang Commit-by: zhang_shengjie;jiang-mingming01;chenyukai;lining23666;wuzhengzhen;cann-robot;yuchen97;kobemini;isaacxu;jinhu_huawei;maohaodi;KenChow;xuyafei;zhangfeifan0709;andy_git;peiyang;wangxiaotian995;jin-xiaohang;wtf_newage;liuyuanchen1;lihuachao;yelongjian;tang-haojie Merged-by: peiyang Description: # Pull Request ## 描述 本PR指在将develop分支的代码同步合入master分支,包括以下特性: 1、dflow替换rt接口为aclrt接口 2、新增modify_conv_data_format_pass 3、新增modify_conv_data_format_pass 4、解决CV融合算子编译告警 5、dflow静态检查修改 6、[Autofuse] 修复slice上提至transpose前的bug 7、修复错误码上报和日志格式问题 8、当concat的对齐值小于等于1时,无意义,跳过这种判断&头文件路径修复 9、ATT性能公式注释及表达式优化 10、SECURITY文件Markdown格式问题修改 11、bugfix for es symbol bind 12、移动非dflow dt并删除冗余的依赖 13、修复te_fusion的全局变量导致的内存持续增长 14、新增Acos ascir 15、rt接口切换为aclrt系列接口:设备管理类 16、GetOrRegisterKernel并发问题 17、修复transform eliminate消除逻辑改图bug 18、es sample更新打印格式 19、新增GeSession使能动态batch的样例 20、修复A2 Dma swap后性能公式问题 21、兼容算子独立升级,添加原命名空间接口 22、修复C++和python处理图名的差异&Power处理特殊 23、修复air转模型构造输入tensor顺序错误的问题 24、Concat融合拓扑排序问题修复 25、基于graph接口的MatMul+Add融合为GEMM自定义pass样例 26、修复udf DT依赖源码proto后没有加依赖找不到头文件的问题 27、npu_arch从3101修改为3510 && logicalOr ascir bugfix ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [ ] 我的代码遵循了项目的代码风格 - [ ] 我已对代码进行了自测 - [ ] 我已更新了相关的文档 - [ ] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [ ] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!10452 个月前
sample: 使用nz数据格式的transformer Co-authored-by: maohaodi<maohaodi@huawei.com> # message auto-generated for no-merge-commit merge: !583 merge nz_sample into develop sample: 使用nz数据格式的transformer Created-by: maohaodi Commit-by: maohaodi Merged-by: cann-robot Description: # Pull Request ## 描述 新增基于GE框架的NZ格式张量图构建示例代码,完整实现从ES构图、NZ格式张量创建到图编译运行的全流程。对比已有Transformer的sample,本次核心修改支持了权重数据为NZ格式,并提供随机输入数据生成及结果验证。代码包含详细注释和格式转换示例,可用于模型优化场景的性能测试与功能验证。 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 参考examples/es/transformer_nz/cpp/README.md和examples/es/transformer_nz/python/README.md中的说明进行编译和执行sample测试 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 See merge request: cann/ge!5832 个月前
docs: 新增DecomposePass Python V1样例及README优化(part3-2) Co-authored-by: kobemini<gengchao4@huawei.com> # message auto-generated for no-merge-commit merge: !2267 merge python_pass_f_0003 into develop docs: 新增DecomposePass Python V1样例及README优化(part3-2) Created-by: kobemini Commit-by: kobemini Merged-by: cann-robot Description: # Pull Request ## 描述 本 PR 为 PatternFusionPass Python 化支持的第三部分,新增 DecomposePass Python V1 样例并优化已有 README 文档结构。 ### 主要变更 1. **新增 6_decompose_grouped_conv_to_splited_pass Python V1 样例** - 新增 python/src/test_python_decompose_pass.py:演示如何使用纯 Python 编写 DecomposePass,将 groups != 1Conv2D 拆分为 Split + Conv2D + Concat - 新增 python/README.md:包含功能描述、环境要求、使用方式、预期日志和 Conda 环境示例 - 新增 cpp/README.md:将原样例根目录 README 拆分为独立 C++ README,保持目录结构一致 2. **优化已有 Python README 文档** - 1_fuse_matmul_add_pass/python/README.md:重构为统一格式(功能描述→环境要求→使用方式→预期日志→Conda 示例) - 4_add_zero_pass/python/README.md:同步格式优化,补充 Conda 环境示例和注意事项 3. **更新主 README 索引** - 在 pattern_base_pass/README.md 中添加 Python V1 样例链接 - 将 6_decompose_grouped_conv_to_splited_pass 的链接更新为 cpp/python 双版本 4. **修复es README 中的失效索引** ## 变更类型 请选择本次引入的变更类型(勾选对应项): - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue 无 ## 如何测试 1. 阅读 README 确认文档描述准确 2. 参照 6_decompose_grouped_conv_to_splited_pass/python/README.md 中的步骤,生成 es_all 插件并通过 ATC 或在线推理验证 Python decompose pass 能正确加载执行 3. 验证 1_fuse_matmul_add_pass4_add_zero_pass 的 Python README 中步骤仍可正常执行 ## 核对清单 - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md) ## 其他信息 本 PR 为 DecomposePass Python 化系列的第二部分,前序 [PR](https://gitcode.com/cann/ge/pull/2256) See merge request: cann/ge!22671 个月前
【fix】: 为examples/es示例脚本添加rm -rf命令安全检查 Co-authored-by: wangxiaotian22<wangxiaotian4@huawei.com> # message auto-generated for no-merge-commit merge: !1935 merge develop into develop 【fix】: 为examples/es示例脚本添加rm -rf命令安全检查 Created-by: wangxiaotian995 Commit-by: wangxiaotian22 Merged-by: cann-robot Description: # Pull Request ## 描述 为examples/es示例脚本添加rm -rf命令安全检查。 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue NA ## 如何测试 NA ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!19351 个月前
README.md

样例使用指导

1、功能描述

本样例使用NZ数据格式对transformer进行构图,旨在帮助构图开发者快速上手关于es的构图方式

2、目录结构

python/
├── src/
|   └── make_transformer_nz_graph.py  // sample文件
├── run_sample.sh                  // 执行脚本
├── CMakeLists.txt                 // 编译脚本
├── README.md                      // README文件

3、使用方法

3.1、准备cann包

  • 通过安装指导 环境准备正确安装toolkitops
  • 设置环境变量 (假设包安装在/usr/local/Ascend/)
source /usr/local/Ascend/cann/set_env.sh 

3.2、编译和执行

  • 注:和 C/C++构图对比,Python构图需要额外添加 LD_LIBRARY_PATH 和 PYTHONPATH(参考sample中的配置方式) 只需运行下述命令即可完成清理、生成接口、构图和DUMP图和执行sample文件:
bash run_sample.sh -t sample_and_run_python

该命令会:

  1. 自动生成ES接口
  2. 编译sample程序
  3. 生成dump图并运行该图

执行成功后会看到:

[Success] sample 执行成功,pbtxt dump 已生成在当前目录。该文件以 ge_onnx_ 开头,可以在 netron 中打开显示

输出文件说明

执行成功后会在当前目录生成以下文件:

  • ge_onnx_*.pbtxt - 图结构的protobuf文本格式,可用netron查看

3.3、日志打印

可执行程序执行过程中如果需要日志打印来辅助定位,可以在bash run_sample.sh -t sample_and_run_python之前设置如下环境变量来让日志打印到屏幕

export ASCEND_SLOG_PRINT_TO_STDOUT=1 #日志打印到屏幕
export ASCEND_GLOBAL_LOG_LEVEL=0 #日志级别为debug级别

3.4、图编译流程中DUMP图

可执行程序执行过程中,如果需要DUMP图来辅助定位图编译流程,可以在 bash run_sample.sh -t sample_and_run_python 之前设置如下环境变量来DUMP图到执行路径下

export DUMP_GE_GRAPH=2 

4、核心概念介绍

4.1、构图步骤如下:

  • 创建图构建器(用于提供构图所需的上下文、工作空间及构建相关方法)
  • 添加起始节点(起始节点指无输入依赖的节点,通常包括图的输入(如 Data 节点)和权重常量(如 Const 节点))
  • 添加中间节点(中间节点为具有输入依赖的计算节点,通常由用户构图逻辑生成,并通过已有节点作为输入连接)
  • 设置图输出(明确图的输出节点,作为计算结果的终点)

4.2、NZ数据格式的说明:

  • NZ数据格式是昇腾亲和的数据格式,在昇腾AI处理器上计算效率更高,通常比ND格式性能更好。
  • 关于NZ数据格式的详细说明,请参考昇腾官网说明:数据排布格式