文件最后提交记录最后更新时间
Arch编码更新 Co-authored-by: hwx805026<hanming9@h-partners.com> # message auto-generated for no-merge-commit merge: !1120 merge master into master Arch编码更新 Created-by: jerry_ming Commit-by: hwx805026 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!11203 个月前
【update/bugfix】ffa/ffag算子资料格式、描述等错误更正;ffag输入校验判断修复 Co-authored-by: caihualilili<liangfuzhan@h-partners.com> # message auto-generated for no-merge-commit merge: !1252 merge ffa_md_modify into master 【update/bugfix】ffa/ffag算子资料格式、描述等错误更正;ffag输入校验判断修复 Created-by: caihualilili Commit-by: caihualilili Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 本次PR主要围绕FusedFloydAttention算子及其反向算子aclnnFusedFloydAttentionGrad,进行了接口重构、文档完善和测试适配以及校验的判断条件的更正。核心目标是统一并简化算子输入参数的命名规范,解决接口命名不一致(如key_0/value_0 vs key1/value1)导致的混淆问题,同时为新增的aclnnFusedFloydAttention算子补充完整的官方接口文档,并修正反向算子的文档错误和约束说明,为开发者提供准确、一致的开发指导。 修改方案涉及代码、文档和测试三个层面。在代码层面,对FusedFloydAttention算子进行了接口重构:移除了key_0/value_0参数,将原有的key_1/value_1重命名为key_2/value_2,并相应更新了算子定义、内核实现及测试用例中的参数传递顺序和命名。在文档层面,统一了所有文档中键值对参数的命名为key1/value1和key2/value2;新增了aclnnFusedFloydAttention算子的完整API文档;修正了aclnnFusedFloydAttentionGrad算子的产品支持、功能描述、参数约束(如N/M/K维度的对齐要求)和示例代码。此外,同步更新了测试代码以适配新的接口命名。同时将FusedFloydAttentionGrad中对于shape校验的判断条件取反,保证功能正常。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> [issues 653](https://gitcode.com/cann/ops-transformer/issues/653) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> FusedFloydAttention 4个功能case通过 FusedFloydAttentionGrad 4个功能case通过 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> FusedFloydAttention:aclnnFusedFloydAttention.md、README.md、FFA算子设计文档.md FusedFloydAttentionGrad:aclnnFusedFloydAttentionGrad.md ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!12523 个月前
【update】FusedFloydAttention正反向算子增加不支持shape的拦截以及相关资料修改 Co-authored-by: caihualilili<liangfuzhan@h-partners.com> # message auto-generated for no-merge-commit merge: !1846 merge ffa_ffag_intercept_unalignedD into master 【update】FusedFloydAttention正反向算子增加不支持shape的拦截以及相关资料修改 Created-by: caihualilili Commit-by: caihualilili Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 本次PR主要对FusedFloydAttention正反向算子进行了一系列文档修正、代码重构和输入校验增强。具体包括:修正了算子文档中关于输入张量维度D的约束描述,使其与底层硬件实现保持一致;重构了算子的tiling(分块)逻辑,将通用校验逻辑剥离至公共模块,并重构了tiling基类以提升架构清晰度和可扩展性;同时,为这些算子新增了严格的输入张量对齐要求和维度值校验,防止因非法输入导致的运行时错误。 ## 修改方案描述 修改方案涉及文档、代码结构和校验逻辑三个层面。 1) 文档更新:统一并明确了FusedFloydAttention和FusedFloydAttentionGrad算子文档中关键维度(N, M, K, D)的取值范围和对齐要求,特别是将维度D的约束明确为仅支持“32/64/128”。 2) 代码重构:将tiling实现中的通用参数检查和形状验证逻辑迁移至公共头文件(fused_floyd_attention_tiling_common.cpp),并重构了tiling基类(FusedFloydAttentionTilingBase),移除冗余常量,将核心分块计算函数定义为纯虚函数,形成清晰的抽象接口。 3) 校验增强:在公共校验函数和梯度算子中,新增了对输入张量特定维度的字节对齐检查(如16字节、128字节对齐)以及头维度D的合法值校验,确保输入符合硬件要求。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 关联Issue [#938](https://gitcode.com/cann/ops-transformer/issues/938) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 精度测试:正向89/89个case,反向43/43个case 功能测试:正向38/38个case,反向28/28个case ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> attention/fused_floyd_attention/docs/aclnnFusedFloydAttention.md attention/fused_floyd_attention_grad/docs/aclnnFusedFloydAttentionGrad.md 更新相关约束说明 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!18462 个月前
common目录整改 Co-authored-by: hello_simida<wangyi206@huawei.com> # message auto-generated for no-merge-commit merge: !4870 merge feature/common_dir_fix_v2 into master common目录整改 Created-by: hello_simida Commit-by: hello_simida Merged-by: cann-robot Description: ## 描述 本次修改对 common/ 目录进行整理,分为两个阶段: - **Phase 1**: 将 common/include/kernel/ 重命名为 common/include/op_kernel/ - **Phase 2**: 将 common/include/tiling_base/common/src/tiling_base/ 合并到 common/include/op_host/common/src/op_host/ 相应的 CMake 配置和所有 #include 路径引用已同步更新。 影响范围: - 351 个文件修改(include 路径更新) - 8 个文件重命名(tiling_base → op_host) - 2 个 CMakeLists.txt 修改 + 多个 tests 目录 CMakeLists.txt 更新 ## 关联的Issue Closes #2246 ## 测试 - 编译验证通过:bash build.sh --pkg --soc=ascend910b --ops=all_gather_matmul_v2 -j16 - 编译产物成功生成 .run 包 ## 文档更新 无 ## 类型标签 - [x] ♻️ 重构 - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!487022 天前
common目录整改 Co-authored-by: hello_simida<wangyi206@huawei.com> # message auto-generated for no-merge-commit merge: !4870 merge feature/common_dir_fix_v2 into master common目录整改 Created-by: hello_simida Commit-by: hello_simida Merged-by: cann-robot Description: ## 描述 本次修改对 common/ 目录进行整理,分为两个阶段: - **Phase 1**: 将 common/include/kernel/ 重命名为 common/include/op_kernel/ - **Phase 2**: 将 common/include/tiling_base/common/src/tiling_base/ 合并到 common/include/op_host/common/src/op_host/ 相应的 CMake 配置和所有 #include 路径引用已同步更新。 影响范围: - 351 个文件修改(include 路径更新) - 8 个文件重命名(tiling_base → op_host) - 2 个 CMakeLists.txt 修改 + 多个 tests 目录 CMakeLists.txt 更新 ## 关联的Issue Closes #2246 ## 测试 - 编译验证通过:bash build.sh --pkg --soc=ascend910b --ops=all_gather_matmul_v2 -j16 - 编译产物成功生成 .run 包 ## 文档更新 无 ## 类型标签 - [x] ♻️ 重构 - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!487022 天前
【update】FusedFloydAttention正反向算子增加不支持shape的拦截以及相关资料修改 Co-authored-by: caihualilili<liangfuzhan@h-partners.com> # message auto-generated for no-merge-commit merge: !1846 merge ffa_ffag_intercept_unalignedD into master 【update】FusedFloydAttention正反向算子增加不支持shape的拦截以及相关资料修改 Created-by: caihualilili Commit-by: caihualilili Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 本次PR主要对FusedFloydAttention正反向算子进行了一系列文档修正、代码重构和输入校验增强。具体包括:修正了算子文档中关于输入张量维度D的约束描述,使其与底层硬件实现保持一致;重构了算子的tiling(分块)逻辑,将通用校验逻辑剥离至公共模块,并重构了tiling基类以提升架构清晰度和可扩展性;同时,为这些算子新增了严格的输入张量对齐要求和维度值校验,防止因非法输入导致的运行时错误。 ## 修改方案描述 修改方案涉及文档、代码结构和校验逻辑三个层面。 1) 文档更新:统一并明确了FusedFloydAttention和FusedFloydAttentionGrad算子文档中关键维度(N, M, K, D)的取值范围和对齐要求,特别是将维度D的约束明确为仅支持“32/64/128”。 2) 代码重构:将tiling实现中的通用参数检查和形状验证逻辑迁移至公共头文件(fused_floyd_attention_tiling_common.cpp),并重构了tiling基类(FusedFloydAttentionTilingBase),移除冗余常量,将核心分块计算函数定义为纯虚函数,形成清晰的抽象接口。 3) 校验增强:在公共校验函数和梯度算子中,新增了对输入张量特定维度的字节对齐检查(如16字节、128字节对齐)以及头维度D的合法值校验,确保输入符合硬件要求。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 关联Issue [#938](https://gitcode.com/cann/ops-transformer/issues/938) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 精度测试:正向89/89个case,反向43/43个case 功能测试:正向38/38个case,反向28/28个case ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> attention/fused_floyd_attention/docs/aclnnFusedFloydAttention.md attention/fused_floyd_attention_grad/docs/aclnnFusedFloydAttentionGrad.md 更新相关约束说明 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!18462 个月前
【update】FusedFloydAttention正反向算子增加不支持shape的拦截以及相关资料修改 Co-authored-by: caihualilili<liangfuzhan@h-partners.com> # message auto-generated for no-merge-commit merge: !1846 merge ffa_ffag_intercept_unalignedD into master 【update】FusedFloydAttention正反向算子增加不支持shape的拦截以及相关资料修改 Created-by: caihualilili Commit-by: caihualilili Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 本次PR主要对FusedFloydAttention正反向算子进行了一系列文档修正、代码重构和输入校验增强。具体包括:修正了算子文档中关于输入张量维度D的约束描述,使其与底层硬件实现保持一致;重构了算子的tiling(分块)逻辑,将通用校验逻辑剥离至公共模块,并重构了tiling基类以提升架构清晰度和可扩展性;同时,为这些算子新增了严格的输入张量对齐要求和维度值校验,防止因非法输入导致的运行时错误。 ## 修改方案描述 修改方案涉及文档、代码结构和校验逻辑三个层面。 1) 文档更新:统一并明确了FusedFloydAttention和FusedFloydAttentionGrad算子文档中关键维度(N, M, K, D)的取值范围和对齐要求,特别是将维度D的约束明确为仅支持“32/64/128”。 2) 代码重构:将tiling实现中的通用参数检查和形状验证逻辑迁移至公共头文件(fused_floyd_attention_tiling_common.cpp),并重构了tiling基类(FusedFloydAttentionTilingBase),移除冗余常量,将核心分块计算函数定义为纯虚函数,形成清晰的抽象接口。 3) 校验增强:在公共校验函数和梯度算子中,新增了对输入张量特定维度的字节对齐检查(如16字节、128字节对齐)以及头维度D的合法值校验,确保输入符合硬件要求。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 关联Issue [#938](https://gitcode.com/cann/ops-transformer/issues/938) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 精度测试:正向89/89个case,反向43/43个case 功能测试:正向38/38个case,反向28/28个case ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> attention/fused_floyd_attention/docs/aclnnFusedFloydAttention.md attention/fused_floyd_attention_grad/docs/aclnnFusedFloydAttentionGrad.md 更新相关约束说明 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!18462 个月前
common目录整改 Co-authored-by: hello_simida<wangyi206@huawei.com> # message auto-generated for no-merge-commit merge: !4870 merge feature/common_dir_fix_v2 into master common目录整改 Created-by: hello_simida Commit-by: hello_simida Merged-by: cann-robot Description: ## 描述 本次修改对 common/ 目录进行整理,分为两个阶段: - **Phase 1**: 将 common/include/kernel/ 重命名为 common/include/op_kernel/ - **Phase 2**: 将 common/include/tiling_base/common/src/tiling_base/ 合并到 common/include/op_host/common/src/op_host/ 相应的 CMake 配置和所有 #include 路径引用已同步更新。 影响范围: - 351 个文件修改(include 路径更新) - 8 个文件重命名(tiling_base → op_host) - 2 个 CMakeLists.txt 修改 + 多个 tests 目录 CMakeLists.txt 更新 ## 关联的Issue Closes #2246 ## 测试 - 编译验证通过:bash build.sh --pkg --soc=ascend910b --ops=all_gather_matmul_v2 -j16 - 编译产物成功生成 .run 包 ## 文档更新 无 ## 类型标签 - [x] ♻️ 重构 - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!487022 天前