cann-robotdocs: 修复 README 编译运行样例链接失效及错误码 EZ9999

文件	最后提交记录	最后更新时间
arch22	统一所有算子获取内核数量方法为通过plantformC api获取，部分强行硬编码为8的算子需要自己手动调整，同时将部分重复在host侧定义的函数修改为使用公共库中的函数 Co-authored-by: Jett.chen<1519755291@qq.com> # message auto-generated for no-merge-commit merge: !163 merge plantformC into master 统一所有算子获取内核数量方法为通过plantformC api获取，部分强行硬编码为8的算子需要自己手动调整 Created-by: 2302_77046878 Commit-by: Jett.chen Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 统一所有算子获取内核数量方法为通过plantformC api获取，部分强行硬编码为8的算子需要自己手动调整，直接进行修改可能会出现预期外的错误 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。例如：关联Issue #000--> https://gitcode.com/cann/ops-blas/issues/136 ## 测试 <!--描述进行了哪些测试来验证你的改动。--> 修改后对于arch22，arch35架构下的算子进行了测试，全部通过 ![image.png](https://raw.gitcode.com/user-images/assets/8916851/1b4a1a18-b126-4957-929b-1fb9cd7be972/image.png 'image.png') ![image.png](https://raw.gitcode.com/user-images/assets/8916851/e6f2bbb5-5ec7-4052-803d-2882f2074957/image.png 'image.png') ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-blas!163	3 天前
arch35	[bugfix] golden的生成方式调整为调用开源openblas接口 Co-authored-by: justsheldon<taoxudong@huawei.com> # message auto-generated for no-merge-commit merge: !188 merge fix_precision into master [bugfix] golden的生成方式调整为调用开源openblas接口 Created-by: justsheldon Commit-by: justsheldon Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 1、golden的生成方式调整为调用开源openblas接口，涉及算子为：syr、syr2、tpsv、trsv、gbmv、getrf_batched、gels_batched 2、修改gels_batched算子的workspace用法 3、同步上述算子的文档描述，保持与实现一致 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。例如：关联Issue #000--> 关联Issue #186 ## 测试 <!--描述进行了哪些测试来验证你的改动。--> ![image.png](https://raw.gitcode.com/user-images/assets/8916851/2646b906-a974-4aaf-befc-34cdf4b3e19d/image.png 'image.png') ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-blas!188	6 天前
README.md	docs: 修复 README 编译运行样例链接失效及错误码 EZ9999 Co-authored-by: Zhang Hua<zhanghua25@mails.ucas.ac.cn> # message auto-generated for no-merge-commit merge: !213 merge docs/issue-fix-readme-link-and-errorcode into master docs: 修复 README 编译运行样例链接失效及错误码 EZ9999 Created-by: zhanghua145 Commit-by: Zhang Hua Merged-by: cann-robot Description: ## 描述修复两个文档问题： 1. 链接修复：所有 `blas/${op}/README.md` 中指向 `compile_and_run_example.md` 的链接路径错误，无法跳转到实际文件 `docs/zh/develop/compile_and_run_example.md`。将 `compile_and_run_example.md` 替换为正确的相对路径 `../../docs/zh/develop/compile_and_run_example.md`。 2. 错误码修复：`compile_and_run_example.md` 中引用了内核层错误码 `EZ9999`，但该错误码在仓库 `include/` 目录及 CANN 官方文档中均不存在。SOC 不匹配时实际报错为 ACL 运行时层 `507035`（向量核异常）。删除 `EZ9999` 引用，仅保留 `507035`。 ## 关联的Issue [#217](https://gitcode.com/cann/ops-blas/issues/217) ## 测试 - 通过 `grep` 验证所有 42 个 blas README 链接路径已更新 - 通过 `grep` 验证仓库中不再包含 `EZ9999` 引用 ## 文档更新 - 42 个 `blas/${op}/README.md`：链接路径修正 - `docs/zh/develop/compile_and_run_example.md`：删除不存在的错误码 `EZ9999` ## 类型标签 - [x] 文档更新 See merge request: cann/ops-blas!213	3 天前

Syr2算子

算子概述

syr2 (Symmetric Rank-2 Update) 实现对称秩-2更新操作。该算子将两个向量的外积组合加到对称矩阵的指定三角区域。

数学表达式：

A = alpha * x * y^T + alpha * y * x^T + A

包含以下接口：

接口名	功能简述
aclblasSsyr2	单精度对称秩-2更新

算子执行接口

aclblasSsyr2

产品支持情况

Ascend 950PR / Ascend 950DT：支持
Atlas A3 训练系列产品 / Atlas A3 推理系列产品：支持
Atlas A2 训练系列产品 / Atlas A2 推理系列产品：支持

函数原型

aclblasStatus_t aclblasSsyr2(aclblasHandle_t handle, aclblasFillMode_t uplo, int n, const float *alpha, const float *x, int incx, const float *y, int incy, float *A, int lda)

参数说明

参数名	输入/输出	参数类型	说明
handle	输入	aclblasHandle_t	ops-blas 库上下文句柄，携带 stream，Host 内存
uplo	输入	aclblasFillMode_t	指定矩阵 A 的存储格式。ACLBLAS_LOWER(122): 下三角，ACLBLAS_UPPER(121): 上三角，Host 内存
n	输入	int	向量 x 和 y 中的元素个数，矩阵 A 的行列数。n >= 0，Host 内存
alpha	输入	const float*（FP32）	标量 alpha 指针，向量乘积缩放因子，Host 内存
x	输入	const float*（FP32）	输入向量，对应公式中的 x。数据类型支持 FLOAT32，数据格式支持 ND，shape 为 [n]，Device 内存
incx	输入	int	x 相邻元素间的内存地址偏移量，incx != 0，Host 内存
y	输入	const float*（FP32）	输入向量，对应公式中的 y。数据类型支持 FLOAT32，数据格式支持 ND，shape 为 [n]，Device 内存
incy	输入	int	y 相邻元素间的内存地址偏移量，incy != 0，Host 内存
A	输入/输出	float*（FP32）	输入/输出矩阵，对应公式中的 A。数据类型支持 FLOAT32，数据格式支持 ND，shape 为 [n, n]，Device 内存
lda	输入	int	矩阵 A 的每列元素的存储步长，lda >= max(1, n)，Host 内存

约束说明

n >= 0，n==0 时直接返回成功
incx != 0，incy != 0
lda >= max(1, n)
算子输入 shape 为 [n]、[n]、[n, n]，输出 shape 为 [n, n]
算子实际计算时，不支持 ND 高维度运算（不支持维度 >= 3 的运算）
Host 侧不做流同步，调用方需自行管理同步