ca4573da创建于 4月20日历史提交

文件	最后提交记录	最后更新时间
docs	aidd_docs_fix Co-authored-by: jisongyuan@h-partners.com<jisongyuan@h-partners.com> # message auto-generated for no-merge-commit merge: !2235 merge 900docss into 9.0.0 aidd_docs_fix Created-by: ji-songyuan Commit-by: jisongyuan@h-partners.com Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 修复aidd扫描文档中的错误 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> [#1263](https://gitcode.com/cann/ops-math/issues/1263) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 不涉及代码修改，只更新文档 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> 大部分文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2235	1 个月前
op_host	feat: support dense mxa8w4 in npu_format_cast Co-authored-by: yuanshuai000<yuanshuai70@huawei.com> # message auto-generated for no-merge-commit merge: !1239 merge feat_npu_format_cast_support_uint8_packed_fp4 into master feat: support dense mxa8w4 in npu_format_cast Created-by: yuanshuai000 Commit-by: yuanshuai000 Merged-by: cann-robot Description: ## 描述 npu_format_cast支持紧凑排布的FLOAT4_E2M1输入进行ND转NZ 改动原因：之前的npu_format_cast仅支持fp32伪装的fp4输入，这样会造成8倍的显存浪费，因此需要支持uint8承载的紧凑排布fp4输入类型改动方案：本仓库中仅新增FLOAT4_E2M1为合法输入。其余改动依赖canndev仓的transdata修改：https://gitcode.com/cann/canndev/pull/80888 ## 关联的Issue https://gitcode.com/cann/ops-math/issues/727 ## 测试自验证了grouped matmul 以及quant batch matmul的mxA8W4数据流，流程及精度均通过。 ## 文档更新 /conversion/npu_format_cast/docs/aclnnNpuFormatCast.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!1239	3 个月前
tests	feat: support dense mxa8w4 in npu_format_cast Co-authored-by: yuanshuai000<yuanshuai70@huawei.com> # message auto-generated for no-merge-commit merge: !1239 merge feat_npu_format_cast_support_uint8_packed_fp4 into master feat: support dense mxa8w4 in npu_format_cast Created-by: yuanshuai000 Commit-by: yuanshuai000 Merged-by: cann-robot Description: ## 描述 npu_format_cast支持紧凑排布的FLOAT4_E2M1输入进行ND转NZ 改动原因：之前的npu_format_cast仅支持fp32伪装的fp4输入，这样会造成8倍的显存浪费，因此需要支持uint8承载的紧凑排布fp4输入类型改动方案：本仓库中仅新增FLOAT4_E2M1为合法输入。其余改动依赖canndev仓的transdata修改：https://gitcode.com/cann/canndev/pull/80888 ## 关联的Issue https://gitcode.com/cann/ops-math/issues/727 ## 测试自验证了grouped matmul 以及quant batch matmul的mxA8W4数据流，流程及精度均通过。 ## 文档更新 /conversion/npu_format_cast/docs/aclnnNpuFormatCast.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!1239	3 个月前
CMakeLists.txt	增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge: !448 merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!448	5 个月前
README.md	doc tool motidy Co-authored-by: caiwenwen<caiwenwen6@h-partners.com> # message auto-generated for no-merge-commit merge: !2186 merge 9.0.0 into 9.0.0 doc tool motidy Created-by: caiwenwen Commit-by: caiwenwen Merged-by: cann-robot Description: ## 描述修改math仓的doc tools检测内容，修改markdown等语法 ## 关联的Issue 关联issue#1262 [https://gitcode.com/cann/ops-math/issues/1262](url) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新更新全部文件 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [X] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2186	1 个月前

NpuFormatCast

本目录仅包含NpuFormatCast算子对应的aclnn接口；如您想要贡献该算子的AscendC实现，请参考贡献流程。