0

0

cann-robot修改整个math仓doc tools修改

6f394ebb创建于 4月17日历史提交

文件	最后提交记录	最后更新时间
docs	修改整个math仓doc tools修改 Co-authored-by: caiwenwen<caiwenwen6@h-partners.com> # message auto-generated for no-merge-commit merge: !2280 merge 9.0.0 into 9.0.0 修改整个math仓doc tools修改 Created-by: caiwenwen Commit-by: caiwenwen Merged-by: cann-robot Description: ## 描述修改math仓的doc tools检测内容，修改markdown等语法 ## 关联的Issue 关联issue#1262 [https://gitcode.com/cann/ops-math/issues/1262](url) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新更新全部文件 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [X] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2280	1 个月前
op_host	aclnn_matmul_compress_dequant apply contigous to bias Co-authored-by: llqx-1<lilongqianxi@h-partners.com> # message auto-generated for no-merge-commit merge: !1825 merge compress_900 into 9.0.0 aclnn_matmul_compress_dequant apply contigous to bias Created-by: llqx-1 Commit-by: llqx-1 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 补充aclnnMatmulCompressDequant接口处理逻辑，对输入bias做Contiguous处理 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!1825	2 个月前
op_kernel	enhance 310p aclnnMatmulCompressDequant Co-authored-by: hellokitty911<lizhixi2@huawei.com> # message auto-generated for no-merge-commit merge: !1698 merge to9_0_0 into 9.0.0 enhance 310p aclnnMatmulCompressDequant Created-by: hellokitty911 Commit-by: hellokitty911 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!1698	2 个月前
tests	增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge: !448 merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!448	5 个月前
CMakeLists.txt	增加A2 A3新算子支持 Co-authored-by: slx2008<shaolixin@huawei.com> # message auto-generated for no-merge-commit merge: !448 merge master into master 增加A2 A3新算子支持 Created-by: songkai111 Commit-by: slx2008 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!448	5 个月前
README.md	修改整个math仓doc tools修改 Co-authored-by: caiwenwen<caiwenwen6@h-partners.com> # message auto-generated for no-merge-commit merge: !2280 merge 9.0.0 into 9.0.0 修改整个math仓doc tools修改 Created-by: caiwenwen Commit-by: caiwenwen Merged-by: cann-robot Description: ## 描述修改math仓的doc tools检测内容，修改markdown等语法 ## 关联的Issue 关联issue#1262 [https://gitcode.com/cann/ops-math/issues/1262](url) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新更新全部文件 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [X] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2280	1 个月前

MatMulV2CompressDequant

产品支持情况

产品	是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品	×
Atlas A2 训练系列产品/Atlas A2 推理系列产品	×

功能说明

算子功能：进行矩阵乘计算时，可先通过msModelSlim工具对右矩阵进行无损压缩，减少内存占用，然后通过本接口完成无损解压缩、矩阵乘和反量化计算。
计算公式：
```
x2_unzip = unzip(x2, compressIndex, compressInfo)
result = (x1 @ x2_unzip + bias) * deqScale
```
其中x2表示右矩阵经过msModelSlim工具压缩后的一维数据，x2_unzip是接口内部进行无损解压缩后的数据（与原始右矩阵数据一致）。

参数说明约束说明

参数名	输入/输出/属性	描述	数据类型	数据格式
x1	输入张量	矩阵乘的左输入，2维张量。	INT8	ND
x2	输入张量	压缩后的矩阵乘右输入，1维张量。	INT8	ND
compressIndex	输入张量	矩阵乘右输入的压缩索引表，1维张量。	INT8	ND
bias	输入张量	偏置项，支持空指针传入。	INT32	ND
deqScale	输入张量	反量化参数，数据类型为UINT64。	UINT64	ND
offsetW	输入张量	矩阵乘右输入的偏移量，当前仅支持空指针传入。	INT8	ND
offsetX	输入属性	矩阵乘左输入的偏移量，当前仅支持0。	INT32	-
compressInfo	输入数组	压缩数据相关信息，包括压缩块信息和原始shape等。	INT64	-
out	输出张量	计算结果输出。	FLOAT16	ND

x1和x2_unzip的Reduce维度大小必须相等。
所有输入张量不支持非连续的Tensor。
deqScale需要将原始float类型参数转换为UINT64数据格式。
当前offsetW仅支持空指针，offsetX仅支持0。

调用说明

调用方式	样例代码	说明
aclnn接口	test_aclnn_matmul_compress_dequant	通过aclnnMatmulCompressDequant接口方式调用MatmulCompressDequant算子。