cann-robotdocs: 修复 README 编译运行样例链接失效及错误码 EZ9999

文件	最后提交记录	最后更新时间
arch22	统一所有算子获取内核数量方法为通过plantformC api获取，部分强行硬编码为8的算子需要自己手动调整，同时将部分重复在host侧定义的函数修改为使用公共库中的函数 Co-authored-by: Jett.chen<1519755291@qq.com> # message auto-generated for no-merge-commit merge: !163 merge plantformC into master 统一所有算子获取内核数量方法为通过plantformC api获取，部分强行硬编码为8的算子需要自己手动调整 Created-by: 2302_77046878 Commit-by: Jett.chen Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 统一所有算子获取内核数量方法为通过plantformC api获取，部分强行硬编码为8的算子需要自己手动调整，直接进行修改可能会出现预期外的错误 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。例如：关联Issue #000--> https://gitcode.com/cann/ops-blas/issues/136 ## 测试 <!--描述进行了哪些测试来验证你的改动。--> 修改后对于arch22，arch35架构下的算子进行了测试，全部通过 ![image.png](https://raw.gitcode.com/user-images/assets/8916851/1b4a1a18-b126-4957-929b-1fb9cd7be972/image.png 'image.png') ![image.png](https://raw.gitcode.com/user-images/assets/8916851/e6f2bbb5-5ec7-4052-803d-2882f2074957/image.png 'image.png') ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-blas!163	2 天前
arch35	feat(blas): 新增面向arch35的aclblasSsymm接口 Co-authored-by: eternityk<taoyikun@huawei.com> # message auto-generated for no-merge-commit merge: !170 merge aclblasSsymm into master feat(blas): 新增面向arch35的aclblasSsymm接口 Created-by: eternityk Commit-by: eternityk Merged-by: cann-robot Description: ## 描述本次新增 arch35 实现，使 SSYMM 在 ascend950 上可用。 SSYMM 计算公式： side=LEFT: C = alpha * A_sym * B + beta * C side=RIGHT: C = alpha * B * A_sym + beta * C 其中 A_sym 为对称矩阵（仅存储 UPPER 或 LOWER 一个三角），B 和 C 为普通矩阵。当前实现范围聚焦于：数据类型：float 对称矩阵乘法语义：LEFT/RIGHT、LOWER/UPPER ## 关联的Issue [#175](https://gitcode.com/cann/ops-blas/issues/175) ## 测试 ![image.png](https://raw.gitcode.com/user-images/assets/8916851/833b1122-2919-4d18-a7de-23d3d13a21a0/image.png 'image.png') ## 文档更新 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-blas!170	4 天前
README.md	docs: 修复 README 编译运行样例链接失效及错误码 EZ9999 Co-authored-by: Zhang Hua<zhanghua25@mails.ucas.ac.cn> # message auto-generated for no-merge-commit merge: !213 merge docs/issue-fix-readme-link-and-errorcode into master docs: 修复 README 编译运行样例链接失效及错误码 EZ9999 Created-by: zhanghua145 Commit-by: Zhang Hua Merged-by: cann-robot Description: ## 描述修复两个文档问题： 1. 链接修复：所有 `blas/${op}/README.md` 中指向 `compile_and_run_example.md` 的链接路径错误，无法跳转到实际文件 `docs/zh/develop/compile_and_run_example.md`。将 `compile_and_run_example.md` 替换为正确的相对路径 `../../docs/zh/develop/compile_and_run_example.md`。 2. 错误码修复：`compile_and_run_example.md` 中引用了内核层错误码 `EZ9999`，但该错误码在仓库 `include/` 目录及 CANN 官方文档中均不存在。SOC 不匹配时实际报错为 ACL 运行时层 `507035`（向量核异常）。删除 `EZ9999` 引用，仅保留 `507035`。 ## 关联的Issue [#217](https://gitcode.com/cann/ops-blas/issues/217) ## 测试 - 通过 `grep` 验证所有 42 个 blas README 链接路径已更新 - 通过 `grep` 验证仓库中不再包含 `EZ9999` 引用 ## 文档更新 - 42 个 `blas/${op}/README.md`：链接路径修正 - `docs/zh/develop/compile_and_run_example.md`：删除不存在的错误码 `EZ9999` ## 类型标签 - [x] 文档更新 See merge request: cann/ops-blas!213	2 天前
ssymm_common_host.h	refactor(blas): flatten directory structure and fix README files Co-authored-by: wuyi_huawei<wuyi36@hisilicon.com> # message auto-generated for no-merge-commit merge: !180 merge docs/issue-167-flatten-blas-structure into master refactor(blas): flatten directory structure and fix README files Created-by: zhanghua145 Commit-by: wuyi_huawei Merged-by: cann-robot Description: ## 描述统一 `blas/` 下所有算子的目录结构规范：算子主目录放置 README.md，arch22/arch35 子目录仅存放源码文件。具体变更： 1. 移除冗余的算子子目录层级：将 `blas/<op>/<variant>/` 扁平化为 `blas/<op>/`，涉及 35 个算子目录 2. 融合多架构 README：将 dot、gemv、gemv_batched、scal、swap、trmv 的 s/c 变体 README 合并为统一文档 3. 清理 arch 子目录 README：删除 dot/arch35、rotm/arch22、sbmv/arch35、spmv/arch22、spmv/arch35、symv/arch35 下的 README.md，将有效内容合并至主目录 README 4. 更新目录结构引用：修正 29 个算子 README 中的目录结构描述，对齐扁平化后的实际路径 ## 关联的Issue [#167](https://gitcode.com/cann/ops-blas/issues/167) ## 测试目录结构重构，不涉及功能变更，原有测试用例不受影响。 ![47e8113b-862a-466f-9bce-857d39fb524e.png](https://raw.gitcode.com/user-images/assets/8916851/4976ba82-e35c-4f1a-96f2-e0a6e77c60b3/47e8113b-862a-466f-9bce-857d39fb524e.png '47e8113b-862a-466f-9bce-857d39fb524e.png') ## 文档更新 - 融合 6 个算子的多架构 README（dot/gemv/gemv_batched/scal/swap/trmv） - 删除 6 个 arch 子目录 README 并合并内容（dot/rotm/sbmv/spmv/symv） - 更新 29 个算子 README 的目录结构引用 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 其他，请描述：目录结构重构 See merge request: cann/ops-blas!180	11 天前
ssymm_common_kernel.h	refactor(blas): flatten directory structure and fix README files Co-authored-by: wuyi_huawei<wuyi36@hisilicon.com> # message auto-generated for no-merge-commit merge: !180 merge docs/issue-167-flatten-blas-structure into master refactor(blas): flatten directory structure and fix README files Created-by: zhanghua145 Commit-by: wuyi_huawei Merged-by: cann-robot Description: ## 描述统一 `blas/` 下所有算子的目录结构规范：算子主目录放置 README.md，arch22/arch35 子目录仅存放源码文件。具体变更： 1. 移除冗余的算子子目录层级：将 `blas/<op>/<variant>/` 扁平化为 `blas/<op>/`，涉及 35 个算子目录 2. 融合多架构 README：将 dot、gemv、gemv_batched、scal、swap、trmv 的 s/c 变体 README 合并为统一文档 3. 清理 arch 子目录 README：删除 dot/arch35、rotm/arch22、sbmv/arch35、spmv/arch22、spmv/arch35、symv/arch35 下的 README.md，将有效内容合并至主目录 README 4. 更新目录结构引用：修正 29 个算子 README 中的目录结构描述，对齐扁平化后的实际路径 ## 关联的Issue [#167](https://gitcode.com/cann/ops-blas/issues/167) ## 测试目录结构重构，不涉及功能变更，原有测试用例不受影响。 ![47e8113b-862a-466f-9bce-857d39fb524e.png](https://raw.gitcode.com/user-images/assets/8916851/4976ba82-e35c-4f1a-96f2-e0a6e77c60b3/47e8113b-862a-466f-9bce-857d39fb524e.png '47e8113b-862a-466f-9bce-857d39fb524e.png') ## 文档更新 - 融合 6 个算子的多架构 README（dot/gemv/gemv_batched/scal/swap/trmv） - 删除 6 个 arch 子目录 README 并合并内容（dot/rotm/sbmv/spmv/symv） - 更新 29 个算子 README 的目录结构引用 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 其他，请描述：目录结构重构 See merge request: cann/ops-blas!180	11 天前
ssymm_common_types.h	refactor(blas): flatten directory structure and fix README files Co-authored-by: wuyi_huawei<wuyi36@hisilicon.com> # message auto-generated for no-merge-commit merge: !180 merge docs/issue-167-flatten-blas-structure into master refactor(blas): flatten directory structure and fix README files Created-by: zhanghua145 Commit-by: wuyi_huawei Merged-by: cann-robot Description: ## 描述统一 `blas/` 下所有算子的目录结构规范：算子主目录放置 README.md，arch22/arch35 子目录仅存放源码文件。具体变更： 1. 移除冗余的算子子目录层级：将 `blas/<op>/<variant>/` 扁平化为 `blas/<op>/`，涉及 35 个算子目录 2. 融合多架构 README：将 dot、gemv、gemv_batched、scal、swap、trmv 的 s/c 变体 README 合并为统一文档 3. 清理 arch 子目录 README：删除 dot/arch35、rotm/arch22、sbmv/arch35、spmv/arch22、spmv/arch35、symv/arch35 下的 README.md，将有效内容合并至主目录 README 4. 更新目录结构引用：修正 29 个算子 README 中的目录结构描述，对齐扁平化后的实际路径 ## 关联的Issue [#167](https://gitcode.com/cann/ops-blas/issues/167) ## 测试目录结构重构，不涉及功能变更，原有测试用例不受影响。 ![47e8113b-862a-466f-9bce-857d39fb524e.png](https://raw.gitcode.com/user-images/assets/8916851/4976ba82-e35c-4f1a-96f2-e0a6e77c60b3/47e8113b-862a-466f-9bce-857d39fb524e.png '47e8113b-862a-466f-9bce-857d39fb524e.png') ## 文档更新 - 融合 6 个算子的多架构 README（dot/gemv/gemv_batched/scal/swap/trmv） - 删除 6 个 arch 子目录 README 并合并内容（dot/rotm/sbmv/spmv/symv） - 更新 29 个算子 README 的目录结构引用 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 其他，请描述：目录结构重构 See merge request: cann/ops-blas!180	11 天前

Symm算子

算子概述

Symm（Single-precision Symmetric Matrix Multiplication）算子实现了单精度浮点对称矩阵与普通矩阵的乘法运算。

数学表达式：

LEFT 模式：C := alpha * A * B + beta * C
RIGHT 模式：C := alpha * B * A + beta * C

包含以下接口：

接口名	功能简述
aclblasSsymm	单精度浮点对称矩阵乘法

算子执行接口

aclblasSsymm

产品支持情况

Ascend 950PR / Ascend 950DT：不支持
Atlas A3 训练系列产品 / Atlas A3 推理系列产品：支持
Atlas A2 训练系列产品 / Atlas A2 推理系列产品：支持

函数原型

aclblasStatus_t aclblasSsymm(aclblasHandle handle, aclblasSideMode_t side, aclblasFillMode_t uplo, int64_t m, int64_t n, const float *alpha, const float *A, int64_t lda, const float *B, int64_t ldb, const float *beta, float *C, int64_t ldc)

参数说明

参数名	输入/输出	参数类型	说明
handle	输入	aclblasHandle	ACL-BLAS 句柄，Host 内存
side	输入	aclblasSideMode_t	A 矩阵位置：ACLBLAS_SIDE_LEFT（左侧）或 ACLBLAS_SIDE_RIGHT（右侧），Host 内存
uplo	输入	aclblasFillMode_t	A 矩阵存储模式：ACLBLAS_LOWER（下三角）或 ACLBLAS_UPPER（上三角），Host 内存
m	输入	int64_t	矩阵 C 的行数，m >= 0，Host 内存
n	输入	int64_t	矩阵 C 的列数，n >= 0，Host 内存
alpha	输入	const float*（FP32）	标量 alpha，不可为 nullptr，Host 内存
A	输入	const float*（FP32）	对称矩阵，side=LEFT 时 m×m，side=RIGHT 时 n×n，Device 内存
lda	输入	int64_t	矩阵 A 的主维，side=LEFT 时 lda >= max(1, m)，side=RIGHT 时 lda >= max(1, n)，Host 内存
B	输入	const float*（FP32）	m×n 普通矩阵，Device 内存
ldb	输入	int64_t	矩阵 B 的主维，ldb >= max(1, n)，Host 内存
beta	输入	const float*（FP32）	标量 beta，不可为 nullptr，Host 内存
C	输入/输出	float*（FP32）	m×n 矩阵，输入旧值，输出新值，Device 内存
ldc	输入	int64_t	矩阵 C 的主维，ldc >= max(1, n)，Host 内存

约束说明

m >= 0, n >= 0
side=LEFT 时：lda >= max(1, m)
side=RIGHT 时：lda >= max(1, n)
ldb >= max(1, n)
ldc >= max(1, n)
alpha、beta 不可为 nullptr