| dynamicpartition新增小w轴模版
Co-authored-by: sunzhongwen1<sunzhongwen1@huawei.com>
# message auto-generated for no-merge-commit merge:
!1380 merge dynamicpartition_newtemplate into master
dynamicpartition新增小w轴模版
Created-by: sunzhongwen1
Commit-by: sunzhongwen1
Merged-by: cann-robot
Description: ## 描述
针对dynamicpartition算子两类比较差的case进行优化:
1.尾轴w很小,特别是w为1,现有方案中每次vf内搬运一个w,w很小的话vf内搬运效率很差,vector计算消耗大量时间。
2.h轴为1的场景,该种case tiling没有进行核内循环计算的处理,纯搬运场景但是是一次只搬一个数。
针对1场景,增加了小w轴模板,对w小于等于6的case进行准入,在vf内使用gather指令进行分区的聚合,提高vf内计算效率。
针对2场景,对tiling逻辑进行修改,准入该种shape进行核内循环的计算,提高搬运效率。
## 关联的Issue
<!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。-->
<!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。-->
https://gitcode.com/cann/ops-math/issues/921
## 测试
<!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。-->
## 文档更新
<!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。-->
## 类型标签
<!-- [x] 表示选中 -->
- [ ] Bug修复
- [ ] 新特性
- [x] 性能优化
- [ ] 文档更新
- [ ] 其他,请描述:
See merge request: cann/ops-math!1380 | 2 个月前 |