文件最后提交记录最后更新时间
【bugfix】修复310P使用.copy_()接口出现脏数据的bug Co-authored-by: 李巍<liwei949@huawei.com> # message auto-generated for no-merge-commit merge: !2061 merge inplace_master into master 【bugfix】修复310P使用.copy_()接口出现脏数据的bug Created-by: li_wei21 Commit-by: 李巍 Merged-by: cann-robot Description: ## 描述 在310P上使用copyNpuToNpu接口替代tensormoveAicore接口,避免搬运小于32Byte数据时引入脏数据 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 泛化测试200例case通过 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!20611 个月前
优化TopkV2算子与aclSetAclOpExecutorRepeatable接口的兼容性 Co-authored-by: caoyan_huawei<caoyan11@huawei.com> # message auto-generated for no-merge-commit merge: !2134 merge cy_04_08_tensor_move into master 优化TopkV2算子与aclSetAclOpExecutorRepeatable接口的兼容性 Created-by: caoyan_huawei Commit-by: caoyan_huawei Merged-by: cann-robot Description: ## 描述 本次PR主要包含三个核心功能:一是为张量移动操作新增了针对特定硬件(AiCore)的接口框架,扩展了底层操作的硬件适配能力;二是利用该新接口,对TopK算子在特定场景(输出张量连续且无需排序)下的数据复制路径进行了性能优化,旨在提升数据传输效率;三是兼容aclSetAclOpExecutorRepeatable接口的使用; ## 测试 UT测试通过 ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!21341 个月前