文件最后提交记录最后更新时间
新增sort算子核内归并模板 Co-authored-by: ConanHuang<huangxiaobin1@huawei.com> # message auto-generated for no-merge-commit merge: !1682 merge master into master 新增sort算子核内归并模板 Created-by: ConanHuang Commit-by: ConanHuang Merged-by: cann-robot Description: ## 描述 1 新增sort算子核内归并模板,三阶段流水线:UB排序(Phase1) -> 四路归并(Phase2) -> 提取输出(Phase3) 2 调整单核归并排序fp32进入条件 ## 关联的Issue https://gitcode.com/cann/ops-math/issues/1013 ## 测试 - 已跑二级冒烟,结果正常 - 已跑基础的150+ ST用例,性能和功能均正常 - 新增7个ST用例,覆盖模板各个核心分支,已验证通过 - 通过调整排序轴大小,分析得到与基数排序的临界点,临界点内本次新增模板优于基数排序,已将临界点设置为模板挑选的依据 ## 文档更新 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!16822 个月前
新增sort算子核内归并模板 Co-authored-by: ConanHuang<huangxiaobin1@huawei.com> # message auto-generated for no-merge-commit merge: !1682 merge master into master 新增sort算子核内归并模板 Created-by: ConanHuang Commit-by: ConanHuang Merged-by: cann-robot Description: ## 描述 1 新增sort算子核内归并模板,三阶段流水线:UB排序(Phase1) -> 四路归并(Phase2) -> 提取输出(Phase3) 2 调整单核归并排序fp32进入条件 ## 关联的Issue https://gitcode.com/cann/ops-math/issues/1013 ## 测试 - 已跑二级冒烟,结果正常 - 已跑基础的150+ ST用例,性能和功能均正常 - 新增7个ST用例,覆盖模板各个核心分支,已验证通过 - 通过调整排序轴大小,分析得到与基数排序的临界点,临界点内本次新增模板优于基数排序,已将临界点设置为模板挑选的依据 ## 文档更新 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!16822 个月前