| 【im2col】修改gather全载模版入口条件,按实际HW大小计算输入输出比率
Co-authored-by: Zhang_Liangchen<zhangliangchen@huawei.com>
# message auto-generated for no-merge-commit merge:
!1547 merge master into master
【im2col】修改gather全载模版入口条件,按实际HW大小计算输入输出比率
Created-by: Zhang_Liangchen
Commit-by: Zhang_Liangchen
Merged-by: cann-robot
Description: ## 描述
解决im2col算子精度问题:当输入输出比值较大(输出远大于输入),gather模版通过输出索引反推输入索引时,算出的输入索引大于数据类型上限,索引溢出导致位置计算错误,临界值为输入/输入>=512。而代码中的比值判断是经过32B对齐后的,存在的问题场景:对齐前输入/输入>=512,对齐后输入/输入<128,仍然走全载模版,出现上述错误
## 关联的Issue
https://gitcode.com/cann/ops-math/issues/904
## 测试
<!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。-->
## 文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->
## 类型标签
<!-- [x] 表示选中 -->
- [x] Bug修复
- [ ] 新特性
- [ ] 性能优化
- [ ] 文档更新
- [x] 其他,请描述:
修改了 NCHWTryFullLoad 函数中的核心判断逻辑,将用于计算输入输出比例的 ratio 从基于对齐后内存大小的 (inHWNeedSize) / outHWNeedSize,更正为基于原始数据元素数量的 (inputHW) / outputHW。
See merge request: cann/ops-math!1547 | 2 个月前 |