ops-math/conversion/mem_set · CANN/ops-math - AtomGit

文件	最后提交记录	最后更新时间
op_api	MemSet算子开发-算子提交 Co-authored-by: RoyHys<huangyuqian6@huawei.com> # message auto-generated for no-merge-commit merge: !939 merge master into master MemSet算子开发-算子提交 Created-by: RoyHys Commit-by: RoyHys Merged-by: cann-robot Description: ## 描述 ### 开发背景继承MemSet Tbe版本算子原型，开发Ascend C版本优化性能 ### 功能支持 1、参考 - 昇腾社区-CANN商用版-Ascend C算子开发接口-Host API-原型注册与管理-OpParamDef-InitValue 所述支持范围，提供如下类型支持范围![image.png](https://raw.gitcode.com/user-images/assets/7649531/ebc74050-ad0f-41b3-a51e-68a56d3feb53/image.png 'image.png') 2、参考Tbe源码中![image.png](https://raw.gitcode.com/user-images/assets/7649531/dec852c5-58d7-4270-a67b-3fa5f4561ed5/image.png 'image.png')最大支持tensor数，Ascend C版本最大支持MemSet-tensor数192个 3、aclnn支持initvalue类型与outputTensor类型不匹配，Geir要求类型的字节大小匹配 ### tbe参数组装分析 1、算子原型如下：memset无输入输出tensor，依赖于框架组装传递参数 ![image.png](https://raw.gitcode.com/user-images/assets/7649531/643d1e32-e029-4676-8a11-3d02949d755b/image.png 'image.png') 2、tbe通过识别动静态编译，从不同位置读取参数信息，该方法不再应用于ascendc，改为全采用TilingContext进行读取，不再区分动静态 ![image.png](https://raw.gitcode.com/user-images/assets/7649531/f3df178d-fa27-4806-8949-1773e15754f2/image.png 'image.png') ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!939	4 个月前
op_graph	MemSet算子开发-算子提交 Co-authored-by: RoyHys<huangyuqian6@huawei.com> # message auto-generated for no-merge-commit merge: !939 merge master into master MemSet算子开发-算子提交 Created-by: RoyHys Commit-by: RoyHys Merged-by: cann-robot Description: ## 描述 ### 开发背景继承MemSet Tbe版本算子原型，开发Ascend C版本优化性能 ### 功能支持 1、参考 - 昇腾社区-CANN商用版-Ascend C算子开发接口-Host API-原型注册与管理-OpParamDef-InitValue 所述支持范围，提供如下类型支持范围![image.png](https://raw.gitcode.com/user-images/assets/7649531/ebc74050-ad0f-41b3-a51e-68a56d3feb53/image.png 'image.png') 2、参考Tbe源码中![image.png](https://raw.gitcode.com/user-images/assets/7649531/dec852c5-58d7-4270-a67b-3fa5f4561ed5/image.png 'image.png')最大支持tensor数，Ascend C版本最大支持MemSet-tensor数192个 3、aclnn支持initvalue类型与outputTensor类型不匹配，Geir要求类型的字节大小匹配 ### tbe参数组装分析 1、算子原型如下：memset无输入输出tensor，依赖于框架组装传递参数 ![image.png](https://raw.gitcode.com/user-images/assets/7649531/643d1e32-e029-4676-8a11-3d02949d755b/image.png 'image.png') 2、tbe通过识别动静态编译，从不同位置读取参数信息，该方法不再应用于ascendc，改为全采用TilingContext进行读取，不再区分动静态 ![image.png](https://raw.gitcode.com/user-images/assets/7649531/f3df178d-fa27-4806-8949-1773e15754f2/image.png 'image.png') ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!939	4 个月前
op_host	refactor: 拆分 tiling 公共头文件，消除 conversion 算子重复依赖 Co-authored-by: tianqiguang<tianqiguang@huawei.com> # message auto-generated for no-merge-commit merge: !2951 merge feature/conversion-dedup into master refactor: 拆分 tiling 公共头文件，消除 conversion 算子重复依赖 Created-by: tianqiguang Commit-by: tianqiguang Merged-by: cann-robot Description: ## 描述将 tiling 基类和模板注册相关定义从 conversion 算子的公共头文件中拆分，消除各 conversion 算子的重复头文件依赖。 ### 改动原因 conversion 目录下 50+ 个算子各自直接引用 `tiling_base.h`、`tiling_util.h` 和 `tiling_templates_registry.h`： - `tiling_base.h` 包含完整 TilingBaseClass 实现（~240行），每个算子编译时都重复展开 - `tiling_templates_registry.h` 内混杂 math 算子的模板注册代码，不应被 conversion 算子依赖 ### 改动方法 1. 新建 `common/inc/op_host/math_tiling_templates_registry.h`：将 math 算子专用的模板注册宏和注册类从此文件中提供 2. 精简 `tiling_base.h`：改为仅转发引用 `tiling_base_class.h` 3. 批量更新 conversion 算子文件的 `#include`： - `tiling_base.h` → `tiling_base_class.h` - `tiling_util.h` → `tiling_base_util.h` - `tiling_templates_registry.h` → `math_tiling_templates_registry.h` 4. 批量更新命名空间引用： - `Ops::Math::OpTiling::TilingBaseClass` → `Ops::Base::TilingBaseClass` - `Ops::Math::OpTiling::EnsureNotScalar` → `Ops::Base::EnsureNotScalar` ## 关联的Issue - #1672 ## 测试 - 涉及的 conversion 算子二级冒烟测试已通过 ## 文档更新无文档变更 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他，请描述：代码重构，消除重复头文件依赖 See merge request: cann/ops-math!2951	7 天前
op_kernel	【算子优化】增加MemSet算子最大支持Tensor数 Co-authored-by: RoyHys<huangyuqian6@huawei.com> # message auto-generated for no-merge-commit merge: !1232 merge master into master 【算子优化】增加MemSet算子最大支持Tensor数 Created-by: RoyHys Commit-by: RoyHys Merged-by: cann-robot Description: ## 描述本次PR扩展了MemSet算子对输入张量数量的支持上限，从原有的192提升至256。主要解决了当算子需要处理更多张量时，因数量限制而无法正常工作的问题，增强了算子的通用性和处理能力，修改了尾核逻辑，准确描述lastCoreSize ## 关联的Issue https://gitcode.com/cann/ops-math/issues/722 ## 测试完成尾核测试 See merge request: cann/ops-math!1232	3 个月前
CMakeLists.txt	适配PG short_soc_version Co-authored-by: xufeng12121<1074805447@qq.com> # message auto-generated for no-merge-commit merge: !2804 merge mc62 into master 适配PG short_soc_version Created-by: xufeng12121 Commit-by: xufeng12121 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 算子适配PG特性，将math仓 mc62cm12a/MC62CM12A 改成 mc62/MC62 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1732 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2804	4 天前