文件最后提交记录最后更新时间
aidd_docs_fix Co-authored-by: jisongyuan@h-partners.com<jisongyuan@h-partners.com> # message auto-generated for no-merge-commit merge: !2235 merge 900docss into 9.0.0 aidd_docs_fix Created-by: ji-songyuan Commit-by: jisongyuan@h-partners.com Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 修复aidd扫描文档中的错误 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> [#1263](https://gitcode.com/cann/ops-math/issues/1263) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 不涉及代码修改,只更新文档 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 大部分文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!22351 个月前
feat: support dense mxa8w4 in npu_format_cast Co-authored-by: yuanshuai000<yuanshuai70@huawei.com> # message auto-generated for no-merge-commit merge: !1239 merge feat_npu_format_cast_support_uint8_packed_fp4 into master feat: support dense mxa8w4 in npu_format_cast Created-by: yuanshuai000 Commit-by: yuanshuai000 Merged-by: cann-robot Description: ## 描述 npu_format_cast支持紧凑排布的FLOAT4_E2M1输入进行ND转NZ 改动原因:之前的npu_format_cast仅支持fp32伪装的fp4输入,这样会造成8倍的显存浪费,因此需要支持uint8承载的紧凑排布fp4输入类型 改动方案:本仓库中仅新增FLOAT4_E2M1为合法输入。其余改动依赖canndev仓的transdata修改:https://gitcode.com/cann/canndev/pull/80888 ## 关联的Issue https://gitcode.com/cann/ops-math/issues/727 ## 测试 自验证了grouped matmul 以及quant batch matmul的mxA8W4数据流,流程及精度均通过。 ## 文档更新 /conversion/npu_format_cast/docs/aclnnNpuFormatCast.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!12393 个月前
feat: support dense mxa8w4 in npu_format_cast Co-authored-by: yuanshuai000<yuanshuai70@huawei.com> # message auto-generated for no-merge-commit merge: !1239 merge feat_npu_format_cast_support_uint8_packed_fp4 into master feat: support dense mxa8w4 in npu_format_cast Created-by: yuanshuai000 Commit-by: yuanshuai000 Merged-by: cann-robot Description: ## 描述 npu_format_cast支持紧凑排布的FLOAT4_E2M1输入进行ND转NZ 改动原因:之前的npu_format_cast仅支持fp32伪装的fp4输入,这样会造成8倍的显存浪费,因此需要支持uint8承载的紧凑排布fp4输入类型 改动方案:本仓库中仅新增FLOAT4_E2M1为合法输入。其余改动依赖canndev仓的transdata修改:https://gitcode.com/cann/canndev/pull/80888 ## 关联的Issue https://gitcode.com/cann/ops-math/issues/727 ## 测试 自验证了grouped matmul 以及quant batch matmul的mxA8W4数据流,流程及精度均通过。 ## 文档更新 /conversion/npu_format_cast/docs/aclnnNpuFormatCast.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!12393 个月前
增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge: !448 merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!4485 个月前
doc tool motidy Co-authored-by: caiwenwen<caiwenwen6@h-partners.com> # message auto-generated for no-merge-commit merge: !2186 merge 9.0.0 into 9.0.0 doc tool motidy Created-by: caiwenwen Commit-by: caiwenwen Merged-by: cann-robot Description: ## 描述 修改math仓的doc tools检测内容,修改markdown等语法 ## 关联的Issue 关联issue#1262 [https://gitcode.com/cann/ops-math/issues/1262](url) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 更新全部文件 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [X] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math!21861 个月前
README.md

NpuFormatCast

本目录仅包含NpuFormatCast算子对应的aclnn接口;如您想要贡献该算子的AscendC实现,请参考贡献流程