文件最后提交记录最后更新时间
as_strided算子检视意见修改、性能优化、bug修复 Co-authored-by: qq_45996812<liaohuming@huawei.com> # message auto-generated for no-merge-commit merge: !1016 merge master into master as_strided算子检视意见修改、性能优化、bug修复 Created-by: liaohuming Commit-by: qq_45996812 Merged-by: cann-robot Description: ## 描述 as_strided算子根据检视意见整改代码,优化UB内gather模板进入条件,修复了单切分tiling及双切分kernel代码中存在的bug。 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue https://gitcode.com/cann/ops-math/issues/597 <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [x] 性能优化 - [ ] 文档更新 - [x] 其他,请描述: 检视意见修改 (1)更改了日志的标题,用context指针取代之前的字符串 https://gitcode.com/cann/ops-math/blob/master/conversion/as_strided/op_host/arch35/as_strided_tiling_arch35.cpp 如: OP_LOGI("As_Strided", "[SetZeroStrideTilingData]blockNum:%u, ubSizePlatForm:%lu, storageOffset:%ld, mainBlockFactor:%ld, tailBlockFactor:%ld.", tilingParam.blockNum, tilingParam.ubSizePlatForm, tilingParam.storageOffset, tilingParam.mainBlockFactor, tilingParam.tailBlockFactor); 改为: OP_LOGI(context, "[SetZeroStrideTilingData]blockNum:%u, ubSizePlatForm:%lu, storageOffset:%ld, mainBlockFactor:%ld, tailBlockFactor:%ld.", tilingParam.blockNum, tilingParam.ubSizePlatForm, tilingParam.storageOffset, tilingParam.mainBlockFactor, tilingParam.tailBlockFactor); (2)将所有下划线变量改为驼峰命名 https://gitcode.com/cann/ops-math/blob/master/conversion/as_strided/op_host/arch35/as_strided_tiling_arch35.h 存在不统一的命名,需要全部改为驼峰命名。 (3)格式化了文件 (4)删除了不必要的头文件引用 tiling不需要引用register/op_def_registry (5)恢复了应该使用static修饰的函数 (6)将之前在进入gather模板之前判断后三轴的乘积是否满足条件,改为切分之后UB内的轴的乘积是否满足条件,平均性能提升65%。 See merge request: cann/ops-math!10163 个月前
init 8 个月前
as_strided算子质量加固与精度提升 Co-authored-by: qq_45996812<liaohuming@huawei.com> # message auto-generated for no-merge-commit merge: !938 merge master into master as_strided算子质量加固与精度提升 Created-by: qq_45996812 Commit-by: qq_45996812 Merged-by: cann-robot Description: ## 描述 (1)修复原tiling存在的bug,以及move_align模板存在的精度问题; (2)增加stride全0模板,SIMT模板,UB内gather模板; (3)优化双切分实现,单双切分进入条件以及b64场景优化。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [x] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!9384 个月前