文件最后提交记录最后更新时间
fix(test): resolve A2 platform test segfaults by fixing cleanup order and FLT_TRUE_MIN compatibility Co-authored-by: Zhang Hua<1302896824@qq.com> # message auto-generated for no-merge-commit merge: !184 merge fix/fill-h-flt-true-min into master fix(test): resolve A2 platform test segfaults by fixing cleanup order and FLT_TRUE_MIN compatibility Created-by: zhanghua145 Commit-by: Zhang Hua Merged-by: cann-robot Description: ## 描述 修复 A2(ascend910_93)平台编译不通过以及BLAS 算子测试 Segmentation fault问题。 **根因**:A2 编译器不支持 FLT_TRUE_MIN;测试清理阶段 aclrtDestroyStreamaclblasDestroy 之前调用,而 aclblasDestroy 内部调用 aclrtSynchronizeStream(h->stream),导致在已销毁的 stream 上执行同步操作,在 A2 平台触发 segfault。 **修复内容**: 1. 将 16 个测试文件中的清理顺序统一改为 aclblasDestroyaclrtDestroyStream(含 blas_test.h 框架和 15 个独立测试文件) 2. 将 fill.hFLT_TRUE_MIN 替换为 std::numeric_limits<float>::denorm_min()(A2 编译器不支持 FLT_TRUE_MIN) **影响范围**:仅修改 test/ 目录下 16 个文件,不涉及算子源码和库代码。 ## 关联的Issue [#176](https://gitcode.com/cann/ops-blas/issues/176) ## 测试 在 A2 Docker 环境中使用 bash build.sh --soc=ascend910_93 --run 全量构建测试通过,覆盖全部算子测试。 ![image.png](https://raw.gitcode.com/user-images/assets/8916851/81e7b94b-b5a7-4ded-85b4-efe08ac3d4fa/image.png 'image.png') 在 A5 Docker 环境中使用 bash build.sh --soc=ascend950 --run 全量构建测试通过,覆盖全部算子测试。 ![image.png](https://raw.gitcode.com/user-images/assets/8916851/fc14ac97-0f0a-460e-b898-62f09c67d679/image.png 'image.png') ## 文档更新 无 ## 类型标签 - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/ops-blas!1842 天前
Refact:重构算子目录结构为家族格式 Co-authored-by: xutianze<xutianze2@huawei.com> # message auto-generated for no-merge-commit merge: !95 merge refact_dir_arc into master Refact:重构算子目录结构为家族格式 Created-by: xutianze Commit-by: xutianze Merged-by: cann-robot Description: ## 描述 将 blas/ 和 test/ 中扁平结构的算子目录重构为 family/operator/archXX/ 家族格式,统一仓内目录规范。 **目录变更:** - blas/: gbmv/sbmv/syr/syr2 移入家族子目录(如 blas/gbmv/arch35/blas/gbmv/sgbmv/arch35/) - test/: gbmv/sbmv/sspmv/ssymv/syr/syr2/stpttr/strttp 移入家族子目录(如 test/sspmv/test/spmv/sspmv/) - 测试文件重命名匹配算子名(如 gbmv_test.cppsgbmv_test.cpp) - 算子 README 从 test/ 移动到 blas/ 对应算子目录下(34 个文件) **构建系统适配:** - test/CMakeLists.txt: 支持家族嵌套路径解析,自动查找 test/family/op/ 结构 - build.sh: 新增 expand_family_ops() 函数,支持 --ops=gbmv 自动展开为具体算子(如 sgbmv);自动发现功能支持家族嵌套目录;测试二进制路径解析适配嵌套结构 **文档更新:** - docs/QUICKSTART.md: scopy 路径更新为 blas/copy/scopy/ - docs/zh/install/dir_structure.md: 目录结构说明更新为 family/operator/archXX/ 格式 - docs/zh/develop/st_develop_guide.md: 测试文件清单更新为 test/<family>/<op>/ 格式 - agent/agents/developer.mdagent/agents/tester.md: 路径模板更新为 {family}/{operator_name} 格式 - agent/skills/blas-new-op-workflow/references/task-prompts.md: 输出路径更新 ## 关联的Issue [#56](https://gitcode.com/cann/ops-blas/issues/56) ## 测试 双平台验证,全部通过,0 失败。 ### arch22 平台 (ascend910b3) **自动发现验证:** bash bash build.sh --run --soc=ascend910b3 **结果:** 自动发现 34 个算子,23 passed / 11 skipped / 0 failed ✅ **通过的算子 (23个):** | 命令 | 结果 | |------|------| | bash build.sh --ops=sasum --soc=ascend910b3 --run | sasum: passed ✅ | | bash build.sh --ops=caxpy --soc=ascend910b3 --run | caxpy: passed ✅ | | bash build.sh --ops=scopy --soc=ascend910b3 --run | scopy: passed ✅ | | bash build.sh --ops=cdot --soc=ascend910b3 --run | cdot: passed ✅ | | bash build.sh --ops=sdot --soc=ascend910b3 --run | sdot: passed ✅ | | bash build.sh --ops=snrm2 --soc=ascend910b3 --run | snrm2: passed ✅ | | bash build.sh --ops=csrot --soc=ascend910b3 --run | csrot: passed ✅ | | bash build.sh --ops=srotm --soc=ascend910b3 --run | srotm: passed ✅ | | bash build.sh --ops=cscal --soc=ascend910b3 --run | cscal: passed ✅ | | bash build.sh --ops=sscal --soc=ascend910b3 --run | sscal: passed ✅ | | bash build.sh --ops=cswap --soc=ascend910b3 --run | cswap: passed ✅ | | bash build.sh --ops=sswap --soc=ascend910b3 --run | sswap: passed ✅ | | bash build.sh --ops=cgemv --soc=ascend910b3 --run | cgemv: passed ✅ | | bash build.sh --ops=cgemv_batched --soc=ascend910b3 --run | cgemv_batched: passed ✅ | | bash build.sh --ops=sger --soc=ascend910b3 --run | sger: passed ✅ | | bash build.sh --ops=cgerc --soc=ascend910b3 --run | cgerc: passed ✅ | | bash build.sh --ops=sspmv --soc=ascend910b3 --run | sspmv: passed ✅ | | bash build.sh --ops=ssymv --soc=ascend910b3 --run | ssymv: passed ✅ | | bash build.sh --ops=stbmv --soc=ascend910b3 --run | stbmv: passed ✅ | | bash build.sh --ops=stpmv --soc=ascend910b3 --run | stpmv: passed ✅ | | bash build.sh --ops=ctrmv --soc=ascend910b3 --run | ctrmv: passed ✅ | | bash build.sh --ops=strmv --soc=ascend910b3 --run | strmv: passed ✅ | | bash build.sh --ops=strsv --soc=ascend910b3 --run | strsv: passed ✅ | **跳过的算子 (11个):** | 算子 | 跳过原因 | |------|---------| | sgbmv, ssbmv, ssyr, ssyr2, stpsv, stpttr, strttp | 仅 arch35 实现 (ascend950) | | blasLtMatmul | 需要 asc-devkit >= 9.1,当前 9.0 | | colwise_mul, complex_mat_dot, iamax | arch22 无实现 | ### arch35 平台 (ascend950) **单算子验证:** | 命令 | 结果 | |------|------| | bash build.sh --ops=gbmv --soc=ascend950 --run | sgbmv: 51 tests passed ✅ | | bash build.sh --ops=sbmv --soc=ascend950 --run | ssbmv: 29 tests passed ✅ | | bash build.sh --ops=syr --soc=ascend950 --run | ssyr: 23 tests passed ✅ | | bash build.sh --ops=syr2 --soc=ascend950 --run | ssyr2: 34 tests passed ✅ | | bash build.sh --ops=spmv --soc=ascend950 --run | sspmv: 20 tests passed ✅ | | bash build.sh --ops=symv --soc=ascend950 --run | ssymv: 20 tests passed ✅ | | bash build.sh --ops=tpttr --soc=ascend950 --run | stpttr: 56 tests passed ✅ | | bash build.sh --ops=trttp --soc=ascend950 --run | strttp: 56 tests passed ✅ | **家族名展开验证:** | 命令 | 展开结果 | 结果 | |------|---------|------| | bash build.sh --ops=gbmv --soc=ascend950 --run | gbmv → sgbmv | 51 tests passed ✅ | | bash build.sh --ops=sbmv --soc=ascend950 --run | sbmv → ssbmv | 29 tests passed ✅ | | bash build.sh --ops=syr --soc=ascend950 --run | syr → ssyr | 23 tests passed ✅ | | bash build.sh --ops=gbmv,sbmv,syr --soc=ascend950 --run | gbmv,sbmv,syr → sgbmv,ssbmv,ssyr | 3 passed, 0 failed ✅ | **自动发现验证:** bash bash build.sh --soc=ascend950 --run **结果:** 自动发现 33 个算子,11 passed / 22 skipped / 0 failed ✅ **Rebase cann/master 后验证:** bash git rebase cann/master # rebase 到 cb1184d bash build.sh --ops=gbmv,sbmv,syr,syr2,spmv,symv,tpttr,trttp --soc=ascend950 --run **结果:** 8 passed, 0 skipped, 0 failed ✅ ### 验证总结 | 平台 | 通过算子数 | 测试用例数 | 失败数 | |------|-----------|-----------|--------| | arch22 (ascend910b3) | 23 | - | 0 | | arch35 (ascend950) | 8 | 289 | 0 | | **总计** | **31** | **289+** | **0** | ## 文档更新 - docs/QUICKSTART.md: scopy 路径更新 - docs/zh/install/dir_structure.md: 目录结构说明更新 - docs/zh/develop/st_develop_guide.md: 测试文件清单更新 - agent/agents/developer.mdagent/agents/tester.md: 路径模板更新 - agent/skills/blas-new-op-workflow/references/task-prompts.md: 输出路径更新 - 34 个算子 README 从 test/ 移动到 blas/ 对应目录 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他,请描述:目录结构重构 See merge request: cann/ops-blas!9524 天前