Fork
0
代码
介绍
代码
Issues
Pull Requests
流水线
Actions
讨论
Wiki
项目成员
分析
项目设置
Fork
0
9.0.0
ops-math
/
conversion
/
npu_format_cast
下载当前目录
cann-robot
aidd_docs_fix
ca4573da
创建于
4月20日
历史提交
文件
最后提交记录
最后更新时间
docs
aidd_docs_fix Co-authored-by: jisongyuan@h-partners.com<jisongyuan@h-partners.com> # message auto-generated for no-merge-commit merge:
!2235
merge 900docss into 9.0.0 aidd_docs_fix Created-by: ji-songyuan Commit-by: jisongyuan@h-partners.com Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 修复aidd扫描文档中的错误 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> [
#1263
](
https://gitcode.com/cann/ops-math/issues/1263)
## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 不涉及代码修改,只更新文档 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 大部分文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math
!2235
1 个月前
op_host
feat: support dense mxa8w4 in npu_format_cast Co-authored-by: yuanshuai000<yuanshuai70@huawei.com> # message auto-generated for no-merge-commit merge:
!1239
merge feat_npu_format_cast_support_uint8_packed_fp4 into master feat: support dense mxa8w4 in npu_format_cast Created-by: yuanshuai000 Commit-by: yuanshuai000 Merged-by: cann-robot Description: ## 描述 npu_format_cast支持紧凑排布的FLOAT4_E2M1输入进行ND转NZ 改动原因:之前的npu_format_cast仅支持fp32伪装的fp4输入,这样会造成8倍的显存浪费,因此需要支持uint8承载的紧凑排布fp4输入类型 改动方案:本仓库中仅新增FLOAT4_E2M1为合法输入。其余改动依赖canndev仓的transdata修改:
https://gitcode.com/cann/canndev/pull/80888
## 关联的Issue
https://gitcode.com/cann/ops-math/issues/727
## 测试 自验证了grouped matmul 以及quant batch matmul的mxA8W4数据流,流程及精度均通过。 ## 文档更新 /conversion/npu_format_cast/docs/aclnnNpuFormatCast.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math
!1239
3 个月前
tests
feat: support dense mxa8w4 in npu_format_cast Co-authored-by: yuanshuai000<yuanshuai70@huawei.com> # message auto-generated for no-merge-commit merge:
!1239
merge feat_npu_format_cast_support_uint8_packed_fp4 into master feat: support dense mxa8w4 in npu_format_cast Created-by: yuanshuai000 Commit-by: yuanshuai000 Merged-by: cann-robot Description: ## 描述 npu_format_cast支持紧凑排布的FLOAT4_E2M1输入进行ND转NZ 改动原因:之前的npu_format_cast仅支持fp32伪装的fp4输入,这样会造成8倍的显存浪费,因此需要支持uint8承载的紧凑排布fp4输入类型 改动方案:本仓库中仅新增FLOAT4_E2M1为合法输入。其余改动依赖canndev仓的transdata修改:
https://gitcode.com/cann/canndev/pull/80888
## 关联的Issue
https://gitcode.com/cann/ops-math/issues/727
## 测试 自验证了grouped matmul 以及quant batch matmul的mxA8W4数据流,流程及精度均通过。 ## 文档更新 /conversion/npu_format_cast/docs/aclnnNpuFormatCast.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math
!1239
3 个月前
CMakeLists.txt
增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge:
!448
merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math
!448
5 个月前
README.md
doc tool motidy Co-authored-by: caiwenwen<caiwenwen6@h-partners.com> # message auto-generated for no-merge-commit merge:
!2186
merge 9.0.0 into 9.0.0 doc tool motidy Created-by: caiwenwen Commit-by: caiwenwen Merged-by: cann-robot Description: ## 描述 修改math仓的doc tools检测内容,修改markdown等语法 ## 关联的Issue 关联issue
#1262
[
https://gitcode.com/cann/ops-math/issues/1262](url)
## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 更新全部文件 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [X] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-math
!2186
1 个月前
README.md
NpuFormatCast
本目录仅包含NpuFormatCast算子对应的aclnn接口;如您想要贡献该算子的AscendC实现,请参考
贡献流程
。