文件最后提交记录最后更新时间
修复A2A3环境下EsTranspose和aclrtGetArgsFromExceptionInfo符号未定义问题 Co-authored-by: y00951989<yangshengjun3@huawei.com> # message auto-generated for no-merge-commit merge: !5077 merge A2A3_pr into master 修复A2A3环境下EsTranspose和aclrtGetArgsFromExceptionInfo符号未定义问题 Created-by: yangshengjun703 Commit-by: y00951989 Merged-by: cann-robot Description: ## 描述 解决A2A3环境下EsTranspose和aclrtGetArgsFromExceptionInfo符号未定义问题 ## 关联Issue 关联的Issue [https://gitcode.com/cann/ops-transformer/issues/2334](url) ## 测试 完成线上A5 A2 A3 rdv 及 本地问题单复现场景A2A3的用例测试,精度通过 # Ascend C 算子代码检视报告 ## 1. 检视概要 **检视文件**:C:\y00951989\5077.diff(171行) **检视模式**:PR 检视(C++安全检视) **检视范围**: - **文件1**:mc2/common/utils/mc2_exception_dump.h - 异常处理动态库加载改造 - **文件2**:mc2/matmul_allto_all/op_graph/fusion_pass/matmul_all_to_all_transpose_a5_fusion_pass.cpp - fusion pass 动态库加载 **核心变更**: - 使用 dlopen/dlsym 动态加载 API 函数,替代直接调用 - 目的:解决符号依赖问题,提升版本兼容性 **问题统计**: - **CRITICAL级别**:2个(空指针解引用、资源泄露) - **MEDIUM级别**:2个(外部输入校验、LOG安全) - **LOW级别**:0个 **检视结论**:该PR引入动态库加载机制解决版本兼容性问题,但存在**2个CRITICAL级别安全风险**,必须在合并前修复。 --- ## 2. 问题详情(按严重级别排序) ### CRITICAL-1:空指针解引用风险(cpp-secure 3.5) **严重级别**:CRITICAL(高) **假设检验过程**: | 步骤 | 假设与证据 | 自信值 | |------|-----------|-------| | **H0** | func 指针在使用前已判空 | 0% | | **证据1** | 行152:static EsTransposeFunc func = GetEsTransposeFunc(); 从 GetEsTransposeFunc() 获取指针 | +40% | | **证据2** | GetEsTransposeFunc() 可能返回 nullptr(dlopen 或 dlsym 失败时,第139、145行) | +30% | | **证据3** | TransposeDL 函数中第154行直接调用 func(...),未进行判空检查 | +30% | | **H1** | **func 指针可能为 nullptr,直接调用会导致程序崩溃** | **100%** | **关联条款**:cpp-secure 3.5(指针使用前判空)、TOPK-1(必须校验函数返回值) **代码路径**:mc2/matmul_allto_all/op_graph/fusion_pass/matmul_all_to_all_transpose_a5_fusion_pass.cpp(diff行152-154) **问题类型**:内存安全 - 空指针解引用 **问题代码片段**: ```cpp // 行150-157(TransposeDL 函数) ge::es::EsTensorHolder TransposeDL(const ge::es::EsTensorLike& x, const ge::es::EsTensorLike& perm) { static EsTransposeFunc func = GetEsTransposeFunc(); // ❌ 可能返回 nullptr auto* builder = ge::es::ResolveBuilder(x, perm); auto result = func(x.ToTensorHolder(builder).GetCTensorHolder(), // ❌ 直接调用,未判空 perm.ToTensorHolder(builder).GetCTensorHolder()); return result; } ``` **修改建议**: ```cpp // ✅ 正确:添加判空检查 ge::es::EsTensorHolder TransposeDL(const ge::es::EsTensorLike& x, const ge::es::EsTensorLike& perm) { static EsTransposeFunc func = GetEsTransposeFunc(); if (func == nullptr) { OPS_LOG_E("MatmulAllToAllTransposeA5FusionPass", "EsTranspose function not loaded"); return ge::es::EsTensorHolder(); // 返回空对象或抛出异常 } auto* builder = ge::es::ResolveBuilder(x, perm); auto result = func(x.ToTensorHolder(builder).GetCTensorHolder(), perm.ToTensorHolder(builder).GetCTensorHolder()); return result; } ``` --- ### CRITICAL-2:资源泄露风险(cpp-secure 5.2) **严重级别**:CRITICAL(高) **假设检验过程**: | 步骤 | 假设与证据 | 自信值 | |------|-----------|-------| | **H0** | dlopen handle 资源正确释放 | 0% | | **证据1** | 行136:dlopen("libes_math.so", RTLD_LAZY | RTLD_GLOBAL) 使用 RTLD_LAZY | RTLD_GLOBAL 标志 | +40% | | **证据2** | RTLD_LAZY | RTLD_GLOBAL 标志会增加动态库的引用计数 | +30% | | **证据3** | 整个函数作用域内无 dlclose 调用(第136-148行) | +30% | | **证据4** | handle 为局部变量,函数返回后丢失,无法后续释放 | +20% | | **H1** | **dlopen 增加了引用计数,但未配对 dlclose,导致资源泄露** | **100%** | **关联条款**:cpp-secure 5.2(资源申请和释放必须匹配) **代码路径**:mc2/matmul_allto_all/op_graph/fusion_pass/matmul_all_to_all_transpose_a5_fusion_pass.cpp(diff行136-148) **问题类型**:资源泄露 - dlopen未配对dlclose **问题分析**: - RTLD_LAZY | RTLD_GLOBAL 标志会加载库并增加引用计数 - 函数返回后 handle 局部变量丢失,无法后续调用 dlclose - 如果库被多次加载(虽然 static func 缓存了结果,但每次检查都会执行 dlopen),会导致库无法被正常卸载 **修改建议**: **方案1:使用 RTLD_NOLOAD,仅查询不增加引用计数**(推荐) ```cpp // ✅ 正确:使用 RTLD_NOLOAD,不增加引用计数 EsTransposeFunc GetEsTransposeFunc() { void* handle = dlopen("libes_math.so", RTLD_NOLOAD | RTLD_LAZY); // 仅查询 if (!handle) { OPS_LOG_E("MatmulAllToAllTransposeA5FusionPass", "dlopen failed: %s", dlerror()); return nullptr; } dlerror(); auto func = reinterpret_cast<EsTransposeFunc>(dlsym(handle, "EsTranspose")); if (dlerror() != nullptr) { OPS_LOG_E("MatmulAllToAllTransposeA5FusionPass", "dlsym EsTranspose failed"); return nullptr; } return func; // RTLD_NOLOAD 不增加引用计数,无需 dlclose } ``` --- ### MEDIUM-1:外部输入参数未判空(cpp-secure 4.1) **严重级别**:MEDIUM(中) **假设检验过程**: | 步骤 | 假设与证据 | 自信值 | |------|-----------|-------| | **H0** | args 参数正确校验 | 0% | | **证据1** | args 参数作为 aclrtExceptionInfo 指针,属于外部输入(来自异常回调) | +40% | | **证据2** | diff 第81行直接使用 args 参数调用函数,未显示判空检查 | +30% | | **证据3** | 虽然理论上异常回调不应传入 nullptr,但规范要求对外部输入必须校验 | +20% | | **H1** | **args 参数作为外部输入,建议添加判空检查** | **70%** | **关联条款**:cpp-secure 4.1(外部输入数据合法性校验) **代码路径**:mc2/common/utils/mc2_exception_dump.h(diff行81) **问题类型**:外部输入校验 - 参数未判空 **问题代码片段**: ```cpp // 行81(Mc2ExceptionImpl 函数) auto ret = aclrtGetArgsFromExceptionInfoFunc(args, &devArgsPtr, &devArgsLen); // args 未判空 ``` **修改建议**: ```cpp // ✅ 正确:添加参数校验 inline void Mc2ExceptionImpl(aclrtExceptionInfo *args, void *userdata, const char *op) { // 添加外部输入校验 if (args == nullptr) { OP_LOGE(OP_NAME, "args is nullptr, invalid exception info"); return; } // Get addr of hccl context from ExceptionInfo void* devArgsPtr = nullptr; uint32_t devArgsLen = 0; ... } ``` --- ### MEDIUM-2:LOG API 潜在空指针风险(cpp-secure 11.1) **严重级别**:MEDIUM(中) **假设检验过程**: | 步骤 | 假设与证据 | 自信值 | |------|-----------|-------| | **H0** | dlerror() 返回值作为 LOG 参数安全 | 0% | | **证据1** | dlerror() 函数在无错误时返回 nullptr | +40% | | **证据2** | 代码中直接将 dlerror() 作为 %s 参数传入 OP_LOGE(第34、37、55、60行) | +30% | | **证据3** | 虽然在错误分支调用理论上应返回错误字符串,但不同平台行为可能有差异 | +20% | | **H1** | **dlerror() 可能返回 nullptr,作为 %s 参数可能导致段错误** | **50%** | **结论**:自信值 **50%** < 60%,无法推翻原假设H0,但存在**需关注**风险点。 **关联条款**:cpp-secure 11.1(LOG API 禁止传入空指针作为字符串参数) **代码路径**:mc2/common/utils/mc2_exception_dump.h(diff行34、37、55、60) **问题类型**:LOG安全 - 潜在空指针风险 **问题代码片段**: ```cpp // 行34、37、55、60 OP_LOGE(OP_NAME, "dlsym aclrtGetArgsFromExceptionInfo failed: %s", dlerror()); // ❌ dlerror() 可能为 nullptr OP_LOGE(OP_NAME, "dlopen failed: %s", dlerror()); // ❌ dlerror() 可能为 nullptr ``` **修改建议**: ```cpp // ✅ 正确:判空或使用安全格式 // 方案1:判空 const char* errMsg = dlerror(); OP_LOGE(OP_NAME, "dlopen failed: %s", errMsg ? errMsg : "unknown error"); // 方案2:使用安全格式 OP_LOGE(OP_NAME, "dlopen failed, error code: %p", dlerror()); // 打印指针地址 ``` --- ## 3. 通过条款 以下条款经检视后确认代码符合规范: ### TOPK-13:禁止 thread_local 变量 - ✅ **通过**:代码中使用 static 变量,未使用 thread_local 关键字 ### TOPK-1:必须校验函数返回值 - ✅ **通过**:dlopen、dlsym、aclrtGetArgsFromExceptionInfo、acldumpGetPath 等关键函数均有返回值校验 ### cpp-secure 3.1:禁止使用未初始化的变量 - ✅ **通过**:所有 static 变量均显式初始化(func = nullptrinitialized = false) ### cpp-secure 11.3:LOG API 参数类型必须与格式化说明符匹配 - ✅ **通过**:%s 对应 dlerror() 返回值(char*),%d 对应 aclError 类型(整型),类型匹配 ### mc2_exception_dump.h 中的 RTLD_NOLOAD 使用 - ✅ **合理**:GetAclrtGetArgsFromExceptionInfoFunc() 和 GetAcldumpGetPathFunc() 使用 RTLD_NOLOAD | RTLD_LAZY,仅查询库是否已加载,不增加引用计数,无需 dlclose --- ## 4. 整体评价 ### 优点总结: 1. **架构设计合理**:使用动态加载机制解决版本兼容性问题,避免硬编码符号依赖 2. **函数指针管理规范**:使用 static 变量缓存函数指针,避免重复加载开销 3. **错误处理完善**:dlopen/dlsym 失败时记录日志,提供错误信息 4. **返回值校验完整**:关键函数调用均有返回值校验和错误处理 5. **RTLD_NOLOAD 使用正确**:mc2_exception_dump.h 中使用 RTLD_NOLOAD 避免增加引用计数 ### 需改进项总结: **必须修改(CRITICAL)**: 1. ✅ TransposeDL 函数添加 func 指针判空检查(防止空指针解引用崩溃) 2. ✅ GetEsTransposeFunc() 修改为 RTLD_NOLOAD 或添加 dlclose(防止资源泄露) **建议修改(MEDIUM)**: 1. ✅ Mc2ExceptionImpl 函数添加 args 参数判空检查(外部输入校验) 2. ✅ LOG 宏中的 dlerror() 返回值判空或使用安全格式(防止段错误) ### 综合评分: | 维度 | 评分 | 说明 | |------|------|------| | **安全编码** | 60/100 | 2个CRITICAL安全问题需立即修复 | | **API使用** | 75/100 | dlopen/dlsym 使用基本规范,但存在资源泄露风险 | | **性能优化** | 90/100 | static 缓存设计合理,避免重复加载 | | **代码规范** | 85/100 | 注释清晰,格式规范 | | **版本兼容性** | 95/100 | 动态加载机制解决符号依赖问题 | **总分**:**81/100** --- ## 5. 结论与建议 ### 检视结论: 该PR引入动态库加载机制(dlopen/dlsym)解决版本兼容性问题,架构设计合理。但存在**2个CRITICAL级别的安全风险**(空指针解引用、资源泄露),必须在合并前修复。 ### 修改要求: **必须修复(阻塞合并)**: 1. ✅ **TransposeDL 函数添加判空检查**(cpp-secure 3.5) - 添加 if (func == nullptr) 检查,防止空指针解引用崩溃 - 返回空对象或抛出异常作为错误处理 2. ✅ **GetEsTransposeFunc() 资源泄露修复**(cpp-secure 5.2) - **方案1(推荐)**:改用 RTLD_NOLOAD | RTLD_LAZY,仅查询不增加引用计数 - **方案2**:缓存 handle 并添加清理函数,确保引用计数匹配 **建议修复(推荐)**: 1. ✅ Mc2ExceptionImpl 函数添加 args 参数校验(cpp-secure 4.1) 2. ✅ LOG 宏中 dlerror() 返回值判空(cpp-secure 11.1) ### 建议操作: 1. **立即修复 CRITICAL 问题**:优先修复空指针解引用和资源泄露问题 2. **补充单元测试**:测试 dlopen/dlsym 失败场景,验证错误处理逻辑 3. **添加文档说明**:在 README 或代码注释中说明动态加载机制的使用场景和注意事项 4. **代码 Review**:邀请团队成员 Review 修复后的代码 5. **性能测试**:验证动态加载对性能的影响(虽然 static 缓存可避免重复加载) --- **报告生成时间**:2026-05-08 **检视人**:AI Code Reviewer (ascendc-ops-reviewer) **检视模式**:PR检视(C++安全检视) **规范版本**:cpp-secure.md、ascendc-topk.md **检视状态**:已完成,发现2个 See merge request: cann/ops-transformer!507721 天前
MmA2A_init Co-authored-by: 何梓洋_蓝区<heziyang5@h-partners.com> # message auto-generated for no-merge-commit merge: !765 merge MmA2a_master into master MmA2A_init Created-by: Hilfsblaetter Commit-by: 何梓洋_蓝区 Merged-by: cann-robot Description: ## 描述 新增算子 MatmulAlltoAll ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!7654 个月前
bugfix: groupSize Co-authored-by: yifux<xiongyifu1@huawei.com> # message auto-generated for no-merge-commit merge: !5215 merge pr_groupsize into master bugfix: groupSize Created-by: xiongyifu Commit-by: yifux Merged-by: cann-robot Description: ## 描述 修改all_to_all_matmul和matmul_all_to_all算子的fallback,添加修饰符static ## 关联的Issue https://gitcode.com/cann/ops-transformer/issues/2406 ## 测试 线上出子包验证 ![image.png](https://raw.gitcode.com/user-images/assets/7673863/173b82b6-771d-4c04-9731-11a3f8684ab9/image.png 'image.png') ![image.png](https://raw.gitcode.com/user-images/assets/7673863/5a057c61-6d9f-4e18-a512-e8ecd0465413/image.png 'image.png') rdv验证 ## 文档更新 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!521520 天前
[AICPU] MatmulAlltoAll算子根据环境变量选择commMode通信引擎 Co-authored-by: adamlwang<wangjingquan2@huawei.com> # message auto-generated for no-merge-commit merge: !5182 merge aicpu into master [AICPU] MatmulAlltoAll算子根据环境变量选择commMode通信引擎 Created-by: adamlwang Commit-by: adamlwang Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> [AICPU] 算子根据环境变量选择commMode通信引擎 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-transformer/issues/2383 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: # 代码检视报告 **项目名称**:matmul_allto_all 算子 PR #5182 检视报告 **检视范围**:PR diff(8 个变更文件) **检视人**:Turing Team **检视日期**:2026-05-12 **检视模式**:PR 检视模式(重点:TOPK 高频问题 + 红线问题) --- ## 🔍 检视概览 | 统计项 | 数值 | | ---- | ---- | | 检视条款总数 | 8 条 | | 通过条款数 | 8 条 | | 发现问题数 | 0 个 | | 需关注点 | 1 个(编译影响) | **核心结论**:变更代码符合 TOPK 高频问题和红线问题要求,无高风险问题。建议关注模板参数组合数量翻倍对编译时间和二进制体积的影响。 --- ## ✅ 检视条款通过情况 ### TOPK 高频问题(4 条) | 条款ID | 条款名称 | 检视结果 | 说明 | | ------ | -------- | -------- | ---- | | TOPK-1 | 必须校验函数返回值 | ✅ PASS | GetCommModeFromEnv() 设计保证返回有效值 | | TOPK-3 | 生命周期内使用局部变量指针 | ✅ PASS | 变更代码无野指针风险 | | TOPK-8 | GM 内存偏移必须用 int64 | ✅ PASS | 变更代码未涉及 GM 偏移计算 | | TOPK-10 | 可整数计算时不允许转浮点 | ✅ PASS | 变更代码使用整数类型运算 | ### C++ 安全编码红线(4 条) | 条款ID | 条款名称 | 检视结果 | 说明 | | ------ | -------- | -------- | ---- | | CPP-2.1 | 有符号整数运算不溢出 | ✅ PASS | 变更代码未涉及溢出风险 | | CPP-2.2 | 无符号整数运算不回绕 | ✅ PASS | 变更代码无回绕风险 | | CPP-3.5 | 指针使用前判空 | ✅ PASS | 变更代码无新增指针使用 | | API-12 | CrossCoreSetFlag/WaitFlag 配对 | ✅ PASS | 变更代码无核间同步逻辑 | --- ## 🔶 需关注点(非红线问题) ### 关注点ID:NOTE-001 | 级别:MEDIUM(需关注) **代码路径**:mc2/matmul_allto_all/op_kernel/arch35/matmul_allto_all_tiling_key.h **问题描述**:模板参数组合数量从 12 个扩展为 24 个(新增 COMMMODE 参数),可能导致: 1. 编译时间显著增加(模板实例化数量翻倍) 2. 二进制体积显著增大(每个组合独立编译) **影响范围**: - 模板参数:新增 COMMMODE(1 位宽度,取值 0 或 1) - 组合数量:12 × 2 = 24 个(覆盖完整,无遗漏) **建议**: - 确认编译时间和二进制体积是否在可接受范围内 - 如影响较大,可考虑优化方案(如动态分支替代静态模板) --- ## 📋 变更文件清单 | 文件类型 | 文件路径 | 代码侧别 | 变更类型 | | -------- | -------- | -------- | -------- | | op_api | aclnn_matmul_allto_all.cpp | Tiling侧 | 新增环境变量读取逻辑 | | op_api | aclnn_quant_matmul_allto_all.cpp | Tiling侧 | 新增环境变量读取逻辑 | | op_graph | matmul_allto_all_gen_task.cpp | Tiling侧 | 新增通信模式分支判断 | | op_host | fp_matmul_allto_all_tiling_base.cpp | Tiling侧 | 新增通信模式 Tiling 参数 | | op_host | kc_quant_matmul_allto_all_tiling_base.cpp | Tiling侧 | 新增通信模式 Tiling 参数 | | op_host | mx_quant_matmul_allto_all_tiling_base.cpp | Tiling侧 | 新增通信模式 Tiling 参数 | | op_kernel | matmul_allto_all_tiling_key.h | Kernel侧 | 新增 COMMMODE 模板参数 | | op_kernel | matmul_allto_all_apt.cpp | Kernel侧 | 新增通信服务器类型选择逻辑 | --- ## 📊 检视统计 **检视条款覆盖**: - TOPK 高频问题:4/13 条(重点条款) - C++ 安全编码红线:4/32 条(重点条款) - API 红线问题:1/9 条(重点条款) **变更代码行数**: - 新增代码:约 60 行 - 修改代码:约 100 行 - 删除代码:约 30 行 --- ## 报告生成时间 2026-05-12 18:00:00 ## 报告状态 已完成检视,无高风险问题,建议关注编译影响 See merge request: cann/ops-transformer!518220 天前
modify matmul_all_to_all & all_to_all_matmul ge ir Co-authored-by: yifux<xiongyifu1@huawei.com> # message auto-generated for no-merge-commit merge: !2694 merge pr_proto into master modify matmul_all_to_all & all_to_all_matmul ge ir Created-by: xiongyifu Commit-by: yifux Merged-by: cann-robot Description: ## 描述 修改 matmul_all_to_all 和 all_to_all_matmul 两个算子的原型IR: 1、补充input tensor x1 和 x2的dtype类型以及对应的描述:DT_FLOAT8_E4M3FN, DT_FLOAT8_E5M2, DT_FLOAT4_E2M1 2、补充input tensor x1_scale 和 x2_scale的dtype以及对应的描述:DT_FLOAT8_E8M0 3、针对 all_to_all_matmul 算子原型,补充output all2all_out的dtype以及对应的描述:DT_FLOAT8_E4M3FN, DT_FLOAT8_E5M2, DT_FLOAT4_E2M1 4、修改attr x1_quant_mode和 x2_quant_mode的部分描述 ## 关联的Issue AR20251028846187 AR20251028846184 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!26942 个月前
matmul alltoall fusion pass from canndev to transformer Co-authored-by: liusixia_gitcode<liusixia@h-partners.com> # message auto-generated for no-merge-commit merge: !3241 merge master into master matmul alltoall fusion pass from canndev to transformer Created-by: liusixia_gitcode Commit-by: liusixia_gitcode Merged-by: cann-robot Description: ## 描述 以matmul alltoall算子为例,使能transformer仓fusion pass文件。新fusion pass文件使用GE ES APIs,基于Pattern方式构图。 ## 关联的Issue https://gitcode.com/cann/ops-transformer/issues/1803 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新特性 - [ ] ⚡ 性能优化 - [x] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!32411 个月前