| optimize the performance of aicpu realdiv operator
Co-authored-by: ZhaiPeiChao<zhaipeichao@huawei.com>
# message auto-generated for no-merge-commit merge:
!2208 merge master into master
optimize the performance of aicpu realdiv operator
Created-by: ZhaiPeiChao
Commit-by: ZhaiPeiChao
Merged-by: cann-robot
Description: ## 描述
优化RealDiv AICPU性能算子
**优化方案**
1. 完全移除 Eigen broadcast —— 算法精简
2. stride-based carry-propagation 替代 GetBroadcastXIndex —— 指令级优化
3. 维度压缩(Dimension Collapsing)—— 循环优化
4. 内层循环 stride 特化 —— 向量化/缓存优化
5. 零堆分配 —— 内存优化
6. IsInputHasZero 优化
## 关联的Issue
<!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123-->
<!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。-->
issue [#1228](https://gitcode.com/cann/ops-math/issues/1228)
## 测试
<!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。-->
**性能最大可达到原有性能的4倍**

## 文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->
不涉及
## 类型标签
<!-- [x] 表示选中 -->
- [ ] Bug修复
- [ ] 新特性
- [x] 性能优化
- [ ] 文档更新
- [ ] 其他,请描述:
See merge request: cann/ops-math!2208 | 1 个月前 |