| 文件 | 最后提交记录 | 最后更新时间 |
|---|---|---|
Feat: 新增面向arch35的aclblasSspr接口 Co-authored-by: yuyuanfeng<yuyuanfeng1@huawei.com> # message auto-generated for no-merge-commit merge: !164 merge master into master Feat: 新增面向arch35的aclblasSspr接口 Created-by: yuyuanfeng Commit-by: yuyuanfeng Merged-by: cann-robot Description: ## 描述 新增 BLAS Level-2 算子 aclblasSpr 的 arch35 (Ascend 950) 实现。 该算子执行对称矩阵 rank-1 更新:A := alpha * x * x^T + A,数据以 packed 格式存储(列优先),支持 UPPER/LOWER 两种填充模式。 采用双路径架构: - UB-x 快速路径:incx==1 且 128<=n<=8192 时,将 x 向量缓存到 UB,多核按列切分 - GM 回退路径:incx!=1 或 n 超出 UB 容量时,直接从 GM 读写 ## 关联的Issue [#153](https://gitcode.com/cann/ops-blas/issues/153) ## 测试 - Host 参数校验:9 个用例全部通过 - Kernel 计算:16 个用例(覆盖 n=1/4/64/10000、UPPER/LOWER、正/负 incx、UB-x/GM 路径) - 910 全量编译通过,不影响已有算子 ## 文档更新 新增 blas/spr/README.md ## 其他改动 - build.sh / cmake/test.cmake / test/CMakeLists.txt:增加扁平目录结构(无类型子目录)的算子发现与测试构建支持 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-blas!164 | 11 天前 | |
Feat: 新增面向arch35的aclblasSspr接口 Co-authored-by: yuyuanfeng<yuyuanfeng1@huawei.com> # message auto-generated for no-merge-commit merge: !164 merge master into master Feat: 新增面向arch35的aclblasSspr接口 Created-by: yuyuanfeng Commit-by: yuyuanfeng Merged-by: cann-robot Description: ## 描述 新增 BLAS Level-2 算子 aclblasSpr 的 arch35 (Ascend 950) 实现。 该算子执行对称矩阵 rank-1 更新:A := alpha * x * x^T + A,数据以 packed 格式存储(列优先),支持 UPPER/LOWER 两种填充模式。 采用双路径架构: - UB-x 快速路径:incx==1 且 128<=n<=8192 时,将 x 向量缓存到 UB,多核按列切分 - GM 回退路径:incx!=1 或 n 超出 UB 容量时,直接从 GM 读写 ## 关联的Issue [#153](https://gitcode.com/cann/ops-blas/issues/153) ## 测试 - Host 参数校验:9 个用例全部通过 - Kernel 计算:16 个用例(覆盖 n=1/4/64/10000、UPPER/LOWER、正/负 incx、UB-x/GM 路径) - 910 全量编译通过,不影响已有算子 ## 文档更新 新增 blas/spr/README.md ## 其他改动 - build.sh / cmake/test.cmake / test/CMakeLists.txt:增加扁平目录结构(无类型子目录)的算子发现与测试构建支持 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-blas!164 | 11 天前 | |
Feat: 新增面向arch35的aclblasSspr接口 Co-authored-by: yuyuanfeng<yuyuanfeng1@huawei.com> # message auto-generated for no-merge-commit merge: !164 merge master into master Feat: 新增面向arch35的aclblasSspr接口 Created-by: yuyuanfeng Commit-by: yuyuanfeng Merged-by: cann-robot Description: ## 描述 新增 BLAS Level-2 算子 aclblasSpr 的 arch35 (Ascend 950) 实现。 该算子执行对称矩阵 rank-1 更新:A := alpha * x * x^T + A,数据以 packed 格式存储(列优先),支持 UPPER/LOWER 两种填充模式。 采用双路径架构: - UB-x 快速路径:incx==1 且 128<=n<=8192 时,将 x 向量缓存到 UB,多核按列切分 - GM 回退路径:incx!=1 或 n 超出 UB 容量时,直接从 GM 读写 ## 关联的Issue [#153](https://gitcode.com/cann/ops-blas/issues/153) ## 测试 - Host 参数校验:9 个用例全部通过 - Kernel 计算:16 个用例(覆盖 n=1/4/64/10000、UPPER/LOWER、正/负 incx、UB-x/GM 路径) - 910 全量编译通过,不影响已有算子 ## 文档更新 新增 blas/spr/README.md ## 其他改动 - build.sh / cmake/test.cmake / test/CMakeLists.txt:增加扁平目录结构(无类型子目录)的算子发现与测试构建支持 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-blas!164 | 11 天前 |
| 文件 | 最后提交记录 | 最后更新时间 |
|---|---|---|
| 11 天前 | ||
| 11 天前 | ||
| 11 天前 |