文件最后提交记录最后更新时间
[feat] add aicpu op: rsqrt Co-authored-by: FengHaozhan<fenghaozhan@huawei.com> # message auto-generated for no-merge-commit merge: !2509 merge rsqrt into master [feat] add aicpu op: rsqrt Created-by: FengHaozhan Commit-by: FengHaozhan Merged-by: cann-robot Description: ## 描述 新增 rsqrt 算子的 AICPU kernel 实现。rsqrt(x) = 1 / sqrt(x)(倒数平方根),补充 TBE 实现之外的 AICPU 执行路径,提升算子在昇腾硬件上的覆盖能力。 主要变更: - math/rsqrt/op_kernel_aicpu/rsqrt_aicpu.cpp/.h:AICPU kernel 核心实现,逐元素计算倒数平方根。 - math/rsqrt/op_kernel_aicpu/rsqrt.json:算子注册配置,定义输入/输出数据类型约束。 - math/rsqrt/tests/ut/op_kernel_aicpu/test_rsqrt.cpp:单元测试,验证 float16/float32/bfloat16 各类型的正确性。 - math/rsqrt/examples/test_geir_rsqrt.cpp:端到端运行示例。 ## 关联的Issue #1447 ## 测试 根据代码变更,测试场景如下: 1. **AICPU 单元测试** - 执行 test_rsqrt.cpp 中的 UT,覆盖 float16、float32、bfloat16 数据类型。 - 验证正常输入(正数)及边界值(趋近 0)下的数值正确性。 2. **算子注册验证** - 验证 rsqrt.json 中算子信息注册正确,接口可正常加载。 3. **示例运行验证** - 编译并运行 test_geir_rsqrt.cpp,确认端到端流程无报错,输出结果与 CPU 参考值误差在可接受范围内。 ## 文档更新 无需文档更新,新增算子实现文件已包含必要注释。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!25091 个月前
[feat] add aicpu op: rsqrt Co-authored-by: FengHaozhan<fenghaozhan@huawei.com> # message auto-generated for no-merge-commit merge: !2509 merge rsqrt into master [feat] add aicpu op: rsqrt Created-by: FengHaozhan Commit-by: FengHaozhan Merged-by: cann-robot Description: ## 描述 新增 rsqrt 算子的 AICPU kernel 实现。rsqrt(x) = 1 / sqrt(x)(倒数平方根),补充 TBE 实现之外的 AICPU 执行路径,提升算子在昇腾硬件上的覆盖能力。 主要变更: - math/rsqrt/op_kernel_aicpu/rsqrt_aicpu.cpp/.h:AICPU kernel 核心实现,逐元素计算倒数平方根。 - math/rsqrt/op_kernel_aicpu/rsqrt.json:算子注册配置,定义输入/输出数据类型约束。 - math/rsqrt/tests/ut/op_kernel_aicpu/test_rsqrt.cpp:单元测试,验证 float16/float32/bfloat16 各类型的正确性。 - math/rsqrt/examples/test_geir_rsqrt.cpp:端到端运行示例。 ## 关联的Issue #1447 ## 测试 根据代码变更,测试场景如下: 1. **AICPU 单元测试** - 执行 test_rsqrt.cpp 中的 UT,覆盖 float16、float32、bfloat16 数据类型。 - 验证正常输入(正数)及边界值(趋近 0)下的数值正确性。 2. **算子注册验证** - 验证 rsqrt.json 中算子信息注册正确,接口可正常加载。 3. **示例运行验证** - 编译并运行 test_geir_rsqrt.cpp,确认端到端流程无报错,输出结果与 CPU 参考值误差在可接受范围内。 ## 文档更新 无需文档更新,新增算子实现文件已包含必要注释。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!25091 个月前
[feat] add aicpu op: rsqrt Co-authored-by: FengHaozhan<fenghaozhan@huawei.com> # message auto-generated for no-merge-commit merge: !2509 merge rsqrt into master [feat] add aicpu op: rsqrt Created-by: FengHaozhan Commit-by: FengHaozhan Merged-by: cann-robot Description: ## 描述 新增 rsqrt 算子的 AICPU kernel 实现。rsqrt(x) = 1 / sqrt(x)(倒数平方根),补充 TBE 实现之外的 AICPU 执行路径,提升算子在昇腾硬件上的覆盖能力。 主要变更: - math/rsqrt/op_kernel_aicpu/rsqrt_aicpu.cpp/.h:AICPU kernel 核心实现,逐元素计算倒数平方根。 - math/rsqrt/op_kernel_aicpu/rsqrt.json:算子注册配置,定义输入/输出数据类型约束。 - math/rsqrt/tests/ut/op_kernel_aicpu/test_rsqrt.cpp:单元测试,验证 float16/float32/bfloat16 各类型的正确性。 - math/rsqrt/examples/test_geir_rsqrt.cpp:端到端运行示例。 ## 关联的Issue #1447 ## 测试 根据代码变更,测试场景如下: 1. **AICPU 单元测试** - 执行 test_rsqrt.cpp 中的 UT,覆盖 float16、float32、bfloat16 数据类型。 - 验证正常输入(正数)及边界值(趋近 0)下的数值正确性。 2. **算子注册验证** - 验证 rsqrt.json 中算子信息注册正确,接口可正常加载。 3. **示例运行验证** - 编译并运行 test_geir_rsqrt.cpp,确认端到端流程无报错,输出结果与 CPU 参考值误差在可接受范围内。 ## 文档更新 无需文档更新,新增算子实现文件已包含必要注释。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!25091 个月前