| [feat] add aicpu op: rsqrt
Co-authored-by: FengHaozhan<fenghaozhan@huawei.com>
# message auto-generated for no-merge-commit merge:
!2509 merge rsqrt into master
[feat] add aicpu op: rsqrt
Created-by: FengHaozhan
Commit-by: FengHaozhan
Merged-by: cann-robot
Description: ## 描述
新增 rsqrt 算子的 AICPU kernel 实现。rsqrt(x) = 1 / sqrt(x)(倒数平方根),补充 TBE 实现之外的 AICPU 执行路径,提升算子在昇腾硬件上的覆盖能力。
主要变更:
- math/rsqrt/op_kernel_aicpu/rsqrt_aicpu.cpp/.h:AICPU kernel 核心实现,逐元素计算倒数平方根。
- math/rsqrt/op_kernel_aicpu/rsqrt.json:算子注册配置,定义输入/输出数据类型约束。
- math/rsqrt/tests/ut/op_kernel_aicpu/test_rsqrt.cpp:单元测试,验证 float16/float32/bfloat16 各类型的正确性。
- math/rsqrt/examples/test_geir_rsqrt.cpp:端到端运行示例。
## 关联的Issue
#1447
## 测试
根据代码变更,测试场景如下:
1. **AICPU 单元测试**
- 执行 test_rsqrt.cpp 中的 UT,覆盖 float16、float32、bfloat16 数据类型。
- 验证正常输入(正数)及边界值(趋近 0)下的数值正确性。
2. **算子注册验证**
- 验证 rsqrt.json 中算子信息注册正确,接口可正常加载。
3. **示例运行验证**
- 编译并运行 test_geir_rsqrt.cpp,确认端到端流程无报错,输出结果与 CPU 参考值误差在可接受范围内。
## 文档更新
无需文档更新,新增算子实现文件已包含必要注释。
## 类型标签
<!-- [x] 表示选中 -->
- [ ] Bug修复
- [x] 新特性
- [ ] 性能优化
- [ ] 文档更新
- [ ] 其他,请描述:
See merge request: cann/ops-math!2509 | 1 个月前 |