| 新增sort算子核内归并模板
Co-authored-by: ConanHuang<huangxiaobin1@huawei.com>
# message auto-generated for no-merge-commit merge:
!1682 merge master into master
新增sort算子核内归并模板
Created-by: ConanHuang
Commit-by: ConanHuang
Merged-by: cann-robot
Description: ## 描述
1 新增sort算子核内归并模板,三阶段流水线:UB排序(Phase1) -> 四路归并(Phase2) -> 提取输出(Phase3)
2 调整单核归并排序fp32进入条件
## 关联的Issue
https://gitcode.com/cann/ops-math/issues/1013
## 测试
- 已跑二级冒烟,结果正常
- 已跑基础的150+ ST用例,性能和功能均正常
- 新增7个ST用例,覆盖模板各个核心分支,已验证通过
- 通过调整排序轴大小,分析得到与基数排序的临界点,临界点内本次新增模板优于基数排序,已将临界点设置为模板挑选的依据
## 文档更新
不涉及
## 类型标签
<!-- [x] 表示选中 -->
- [ ] Bug修复
- [x] 新特性
- [ ] 性能优化
- [ ] 文档更新
- [ ] 其他,请描述:
See merge request: cann/ops-math!1682 | 2 个月前 |