文件最后提交记录最后更新时间
新增FusedFloydAttn/FusedFloydAttnGrad算子实现 Co-authored-by: caihualilili<liangfuzhan@h-partners.com> # message auto-generated for no-merge-commit merge: !826 merge ffa_ffag_opensource into master 新增FusedFloydAttn/FusedFloydAttnGrad算子实现 Created-by: caihualilili Commit-by: caihualilili Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!8264 个月前
FusedFloydAttentionGrad和FFN算子tensor类型入参添加转连续操作 Co-authored-by: 镜心<wangyungfei@h-partners.com> # message auto-generated for no-merge-commit merge: !2834 merge contiguous into master FusedFloydAttentionGrad和FFN算子tensor类型入参添加转连续操作 Created-by: mirror-center Commit-by: 镜心 Merged-by: cann-robot Description: ## 问题/功能描述 本次PR为FusedFloydAttentionGrad和FFN(Feed-Forward Network)两个算子的多个输入张量添加了转连续操作。此修改旨在优化算子执行前的数据预处理,通过框架自动确保输入张量在内存中是连续存储的,从而减少非连续内存访问带来的开销,提升后续计算内核的执行效率和整体性能。 ## 类型标签 <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] ♻️ 重构 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!28342 个月前
新增FusedFloydAttn/FusedFloydAttnGrad算子实现 Co-authored-by: caihualilili<liangfuzhan@h-partners.com> # message auto-generated for no-merge-commit merge: !826 merge ffa_ffag_opensource into master 新增FusedFloydAttn/FusedFloydAttnGrad算子实现 Created-by: caihualilili Commit-by: caihualilili Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!8264 个月前
common目录整改 Co-authored-by: hello_simida<wangyi206@huawei.com> # message auto-generated for no-merge-commit merge: !4870 merge feature/common_dir_fix_v2 into master common目录整改 Created-by: hello_simida Commit-by: hello_simida Merged-by: cann-robot Description: ## 描述 本次修改对 common/ 目录进行整理,分为两个阶段: - **Phase 1**: 将 common/include/kernel/ 重命名为 common/include/op_kernel/ - **Phase 2**: 将 common/include/tiling_base/common/src/tiling_base/ 合并到 common/include/op_host/common/src/op_host/ 相应的 CMake 配置和所有 #include 路径引用已同步更新。 影响范围: - 351 个文件修改(include 路径更新) - 8 个文件重命名(tiling_base → op_host) - 2 个 CMakeLists.txt 修改 + 多个 tests 目录 CMakeLists.txt 更新 ## 关联的Issue Closes #2246 ## 测试 - 编译验证通过:bash build.sh --pkg --soc=ascend910b --ops=all_gather_matmul_v2 -j16 - 编译产物成功生成 .run 包 ## 文档更新 无 ## 类型标签 - [x] ♻️ 重构 - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!487026 天前
新增FusedFloydAttn/FusedFloydAttnGrad算子实现 Co-authored-by: caihualilili<liangfuzhan@h-partners.com> # message auto-generated for no-merge-commit merge: !826 merge ffa_ffag_opensource into master 新增FusedFloydAttn/FusedFloydAttnGrad算子实现 Created-by: caihualilili Commit-by: caihualilili Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #000--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!8264 个月前
【update】FusedFloydAttention正反向算子增加不支持shape的拦截以及相关资料修改 Co-authored-by: caihualilili<liangfuzhan@h-partners.com> # message auto-generated for no-merge-commit merge: !1846 merge ffa_ffag_intercept_unalignedD into master 【update】FusedFloydAttention正反向算子增加不支持shape的拦截以及相关资料修改 Created-by: caihualilili Commit-by: caihualilili Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 本次PR主要对FusedFloydAttention正反向算子进行了一系列文档修正、代码重构和输入校验增强。具体包括:修正了算子文档中关于输入张量维度D的约束描述,使其与底层硬件实现保持一致;重构了算子的tiling(分块)逻辑,将通用校验逻辑剥离至公共模块,并重构了tiling基类以提升架构清晰度和可扩展性;同时,为这些算子新增了严格的输入张量对齐要求和维度值校验,防止因非法输入导致的运行时错误。 ## 修改方案描述 修改方案涉及文档、代码结构和校验逻辑三个层面。 1) 文档更新:统一并明确了FusedFloydAttention和FusedFloydAttentionGrad算子文档中关键维度(N, M, K, D)的取值范围和对齐要求,特别是将维度D的约束明确为仅支持“32/64/128”。 2) 代码重构:将tiling实现中的通用参数检查和形状验证逻辑迁移至公共头文件(fused_floyd_attention_tiling_common.cpp),并重构了tiling基类(FusedFloydAttentionTilingBase),移除冗余常量,将核心分块计算函数定义为纯虚函数,形成清晰的抽象接口。 3) 校验增强:在公共校验函数和梯度算子中,新增了对输入张量特定维度的字节对齐检查(如16字节、128字节对齐)以及头维度D的合法值校验,确保输入符合硬件要求。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 关联Issue [#938](https://gitcode.com/cann/ops-transformer/issues/938) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 精度测试:正向89/89个case,反向43/43个case 功能测试:正向38/38个case,反向28/28个case ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> attention/fused_floyd_attention/docs/aclnnFusedFloydAttention.md attention/fused_floyd_attention_grad/docs/aclnnFusedFloydAttentionGrad.md 更新相关约束说明 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!18463 个月前
【update】FusedFloydAttention正反向算子增加不支持shape的拦截以及相关资料修改 Co-authored-by: caihualilili<liangfuzhan@h-partners.com> # message auto-generated for no-merge-commit merge: !1846 merge ffa_ffag_intercept_unalignedD into master 【update】FusedFloydAttention正反向算子增加不支持shape的拦截以及相关资料修改 Created-by: caihualilili Commit-by: caihualilili Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 本次PR主要对FusedFloydAttention正反向算子进行了一系列文档修正、代码重构和输入校验增强。具体包括:修正了算子文档中关于输入张量维度D的约束描述,使其与底层硬件实现保持一致;重构了算子的tiling(分块)逻辑,将通用校验逻辑剥离至公共模块,并重构了tiling基类以提升架构清晰度和可扩展性;同时,为这些算子新增了严格的输入张量对齐要求和维度值校验,防止因非法输入导致的运行时错误。 ## 修改方案描述 修改方案涉及文档、代码结构和校验逻辑三个层面。 1) 文档更新:统一并明确了FusedFloydAttention和FusedFloydAttentionGrad算子文档中关键维度(N, M, K, D)的取值范围和对齐要求,特别是将维度D的约束明确为仅支持“32/64/128”。 2) 代码重构:将tiling实现中的通用参数检查和形状验证逻辑迁移至公共头文件(fused_floyd_attention_tiling_common.cpp),并重构了tiling基类(FusedFloydAttentionTilingBase),移除冗余常量,将核心分块计算函数定义为纯虚函数,形成清晰的抽象接口。 3) 校验增强:在公共校验函数和梯度算子中,新增了对输入张量特定维度的字节对齐检查(如16字节、128字节对齐)以及头维度D的合法值校验,确保输入符合硬件要求。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 关联Issue [#938](https://gitcode.com/cann/ops-transformer/issues/938) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 精度测试:正向89/89个case,反向43/43个case 功能测试:正向38/38个case,反向28/28个case ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> attention/fused_floyd_attention/docs/aclnnFusedFloydAttention.md attention/fused_floyd_attention_grad/docs/aclnnFusedFloydAttentionGrad.md 更新相关约束说明 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!18463 个月前
common目录整改 Co-authored-by: hello_simida<wangyi206@huawei.com> # message auto-generated for no-merge-commit merge: !4870 merge feature/common_dir_fix_v2 into master common目录整改 Created-by: hello_simida Commit-by: hello_simida Merged-by: cann-robot Description: ## 描述 本次修改对 common/ 目录进行整理,分为两个阶段: - **Phase 1**: 将 common/include/kernel/ 重命名为 common/include/op_kernel/ - **Phase 2**: 将 common/include/tiling_base/common/src/tiling_base/ 合并到 common/include/op_host/common/src/op_host/ 相应的 CMake 配置和所有 #include 路径引用已同步更新。 影响范围: - 351 个文件修改(include 路径更新) - 8 个文件重命名(tiling_base → op_host) - 2 个 CMakeLists.txt 修改 + 多个 tests 目录 CMakeLists.txt 更新 ## 关联的Issue Closes #2246 ## 测试 - 编译验证通过:bash build.sh --pkg --soc=ascend910b --ops=all_gather_matmul_v2 -j16 - 编译产物成功生成 .run 包 ## 文档更新 无 ## 类型标签 - [x] ♻️ 重构 - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!487026 天前
common目录整改 Co-authored-by: hello_simida<wangyi206@huawei.com> # message auto-generated for no-merge-commit merge: !4870 merge feature/common_dir_fix_v2 into master common目录整改 Created-by: hello_simida Commit-by: hello_simida Merged-by: cann-robot Description: ## 描述 本次修改对 common/ 目录进行整理,分为两个阶段: - **Phase 1**: 将 common/include/kernel/ 重命名为 common/include/op_kernel/ - **Phase 2**: 将 common/include/tiling_base/common/src/tiling_base/ 合并到 common/include/op_host/common/src/op_host/ 相应的 CMake 配置和所有 #include 路径引用已同步更新。 影响范围: - 351 个文件修改(include 路径更新) - 8 个文件重命名(tiling_base → op_host) - 2 个 CMakeLists.txt 修改 + 多个 tests 目录 CMakeLists.txt 更新 ## 关联的Issue Closes #2246 ## 测试 - 编译验证通过:bash build.sh --pkg --soc=ascend910b --ops=all_gather_matmul_v2 -j16 - 编译产物成功生成 .run 包 ## 文档更新 无 ## 类型标签 - [x] ♻️ 重构 - [ ] 🐛 Bug 修复 - [ ] ✨ 新特性 - [ ] ⚡ 性能优化 - [ ] 🧪 测试 - [ ] 📦 构建/CI - [ ] 🔧 配置变更 - [ ] 📝 文档更新 - [ ] ⬆️ 依赖升级 - [ ] 🔒 安全修复 - [ ] 🧹 代码清理 - [ ] ❓ 其他,请描述: See merge request: cann/ops-transformer!487026 天前
【update】FusedFloydAttention正反向算子增加不支持shape的拦截以及相关资料修改 Co-authored-by: caihualilili<liangfuzhan@h-partners.com> # message auto-generated for no-merge-commit merge: !1846 merge ffa_ffag_intercept_unalignedD into master 【update】FusedFloydAttention正反向算子增加不支持shape的拦截以及相关资料修改 Created-by: caihualilili Commit-by: caihualilili Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 本次PR主要对FusedFloydAttention正反向算子进行了一系列文档修正、代码重构和输入校验增强。具体包括:修正了算子文档中关于输入张量维度D的约束描述,使其与底层硬件实现保持一致;重构了算子的tiling(分块)逻辑,将通用校验逻辑剥离至公共模块,并重构了tiling基类以提升架构清晰度和可扩展性;同时,为这些算子新增了严格的输入张量对齐要求和维度值校验,防止因非法输入导致的运行时错误。 ## 修改方案描述 修改方案涉及文档、代码结构和校验逻辑三个层面。 1) 文档更新:统一并明确了FusedFloydAttention和FusedFloydAttentionGrad算子文档中关键维度(N, M, K, D)的取值范围和对齐要求,特别是将维度D的约束明确为仅支持“32/64/128”。 2) 代码重构:将tiling实现中的通用参数检查和形状验证逻辑迁移至公共头文件(fused_floyd_attention_tiling_common.cpp),并重构了tiling基类(FusedFloydAttentionTilingBase),移除冗余常量,将核心分块计算函数定义为纯虚函数,形成清晰的抽象接口。 3) 校验增强:在公共校验函数和梯度算子中,新增了对输入张量特定维度的字节对齐检查(如16字节、128字节对齐)以及头维度D的合法值校验,确保输入符合硬件要求。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> 关联Issue [#938](https://gitcode.com/cann/ops-transformer/issues/938) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 精度测试:正向89/89个case,反向43/43个case 功能测试:正向38/38个case,反向28/28个case ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> attention/fused_floyd_attention/docs/aclnnFusedFloydAttention.md attention/fused_floyd_attention_grad/docs/aclnnFusedFloydAttentionGrad.md 更新相关约束说明 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-transformer!18463 个月前