文件最后提交记录最后更新时间
MemSet算子开发-算子提交 Co-authored-by: RoyHys<huangyuqian6@huawei.com> # message auto-generated for no-merge-commit merge: !939 merge master into master MemSet算子开发-算子提交 Created-by: RoyHys Commit-by: RoyHys Merged-by: cann-robot Description: ## 描述 ### 开发背景 继承MemSet Tbe版本算子原型,开发Ascend C版本优化性能 ### 功能支持 1、参考 - 昇腾社区-CANN商用版-Ascend C算子开发接口-Host API-原型注册与管理-OpParamDef-InitValue 所述支持范围,提供如下类型支持范围![image.png](https://raw.gitcode.com/user-images/assets/7649531/ebc74050-ad0f-41b3-a51e-68a56d3feb53/image.png 'image.png') 2、参考Tbe源码中![image.png](https://raw.gitcode.com/user-images/assets/7649531/dec852c5-58d7-4270-a67b-3fa5f4561ed5/image.png 'image.png')最大支持tensor数,Ascend C版本最大支持MemSet-tensor数192个 3、aclnn支持initvalue类型与outputTensor类型不匹配,Geir要求类型的字节大小匹配 ### tbe参数组装分析 1、算子原型如下:memset无输入输出tensor,依赖于框架组装传递参数 ![image.png](https://raw.gitcode.com/user-images/assets/7649531/643d1e32-e029-4676-8a11-3d02949d755b/image.png 'image.png') 2、tbe通过识别动静态编译,从不同位置读取参数信息,该方法不再应用于ascendc,改为全采用TilingContext进行读取,不再区分动静态 ![image.png](https://raw.gitcode.com/user-images/assets/7649531/f3df178d-fa27-4806-8949-1773e15754f2/image.png 'image.png') ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!9394 个月前
MemSet算子开发-算子提交 Co-authored-by: RoyHys<huangyuqian6@huawei.com> # message auto-generated for no-merge-commit merge: !939 merge master into master MemSet算子开发-算子提交 Created-by: RoyHys Commit-by: RoyHys Merged-by: cann-robot Description: ## 描述 ### 开发背景 继承MemSet Tbe版本算子原型,开发Ascend C版本优化性能 ### 功能支持 1、参考 - 昇腾社区-CANN商用版-Ascend C算子开发接口-Host API-原型注册与管理-OpParamDef-InitValue 所述支持范围,提供如下类型支持范围![image.png](https://raw.gitcode.com/user-images/assets/7649531/ebc74050-ad0f-41b3-a51e-68a56d3feb53/image.png 'image.png') 2、参考Tbe源码中![image.png](https://raw.gitcode.com/user-images/assets/7649531/dec852c5-58d7-4270-a67b-3fa5f4561ed5/image.png 'image.png')最大支持tensor数,Ascend C版本最大支持MemSet-tensor数192个 3、aclnn支持initvalue类型与outputTensor类型不匹配,Geir要求类型的字节大小匹配 ### tbe参数组装分析 1、算子原型如下:memset无输入输出tensor,依赖于框架组装传递参数 ![image.png](https://raw.gitcode.com/user-images/assets/7649531/643d1e32-e029-4676-8a11-3d02949d755b/image.png 'image.png') 2、tbe通过识别动静态编译,从不同位置读取参数信息,该方法不再应用于ascendc,改为全采用TilingContext进行读取,不再区分动静态 ![image.png](https://raw.gitcode.com/user-images/assets/7649531/f3df178d-fa27-4806-8949-1773e15754f2/image.png 'image.png') ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!9394 个月前
refactor: 拆分 tiling 公共头文件,消除 conversion 算子重复依赖 Co-authored-by: tianqiguang<tianqiguang@huawei.com> # message auto-generated for no-merge-commit merge: !2951 merge feature/conversion-dedup into master refactor: 拆分 tiling 公共头文件,消除 conversion 算子重复依赖 Created-by: tianqiguang Commit-by: tianqiguang Merged-by: cann-robot Description: ## 描述 将 tiling 基类和模板注册相关定义从 conversion 算子的公共头文件中拆分,消除各 conversion 算子的重复头文件依赖。 ### 改动原因 conversion 目录下 50+ 个算子各自直接引用 tiling_base.htiling_util.htiling_templates_registry.h: - tiling_base.h 包含完整 TilingBaseClass 实现(~240行),每个算子编译时都重复展开 - tiling_templates_registry.h 内混杂 math 算子的模板注册代码,不应被 conversion 算子依赖 ### 改动方法 1. 新建 common/inc/op_host/math_tiling_templates_registry.h:将 math 算子专用的模板注册宏和注册类从此文件中提供 2. 精简 tiling_base.h:改为仅转发引用 tiling_base_class.h 3. 批量更新 conversion 算子文件的 #include: - tiling_base.htiling_base_class.h - tiling_util.htiling_base_util.h - tiling_templates_registry.hmath_tiling_templates_registry.h 4. 批量更新命名空间引用: - Ops::Math::OpTiling::TilingBaseClassOps::Base::TilingBaseClass - Ops::Math::OpTiling::EnsureNotScalarOps::Base::EnsureNotScalar ## 关联的Issue - #1672 ## 测试 - 涉及的 conversion 算子二级冒烟测试已通过 ## 文档更新 无文档变更 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:代码重构,消除重复头文件依赖 See merge request: cann/ops-math!29517 天前
【算子优化】增加MemSet算子最大支持Tensor数 Co-authored-by: RoyHys<huangyuqian6@huawei.com> # message auto-generated for no-merge-commit merge: !1232 merge master into master 【算子优化】增加MemSet算子最大支持Tensor数 Created-by: RoyHys Commit-by: RoyHys Merged-by: cann-robot Description: ## 描述 本次PR扩展了MemSet算子对输入张量数量的支持上限,从原有的192提升至256。主要解决了当算子需要处理更多张量时,因数量限制而无法正常工作的问题,增强了算子的通用性和处理能力,修改了尾核逻辑,准确描述lastCoreSize ## 关联的Issue https://gitcode.com/cann/ops-math/issues/722 ## 测试 完成尾核测试 See merge request: cann/ops-math!12323 个月前
适配PG short_soc_version Co-authored-by: xufeng12121<1074805447@qq.com> # message auto-generated for no-merge-commit merge: !2804 merge mc62 into master 适配PG short_soc_version Created-by: xufeng12121 Commit-by: xufeng12121 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 算子适配PG特性,将math仓 mc62cm12a/MC62CM12A 改成 mc62/MC62 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1732 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!28044 天前