| fix: 硬件故障不执行exception dump
Co-authored-by: yring_8<yangrui1@huawei.com>
# message auto-generated for no-merge-commit merge:
!2616 merge master into master
fix: 硬件故障不执行exception dump
Created-by: yring_8
Commit-by: yring_8
Merged-by: cann-robot
Description: # Pull Request
## 描述
本次 PR 调整 adump 异常 dump 逻辑,对硬件故障类异常不再触发异常 dump,避免在设备内存故障、疑似设备内存故障、链路故障等场景继续执行 dump 流程。
主要变更:
- 在 NeedDumpException 中新增硬件故障 retcode 过滤:
- ACL_ERROR_RT_DEVICE_MEM_ERROR
- ACL_ERROR_RT_SUSPECT_DEVICE_MEM_ERROR
- ACL_ERROR_RT_LINK_ERROR
- 将 NeedDumpException 校验前移到 DumpException 入口,统一异常过滤逻辑。
- 移除普通异常、args 异常、detail 异常分支中的重复过滤校验。
- 合并并补充 UT,统一验证 overflow 和硬件故障 retcode 均不需要 dump。
## 变更类型
- [x] 🐛 Bug 修复
- [ ] ✨ 新功能
- [ ] 💄 代码风格更新(格式化,局部变量)
- [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动)
- [ ] 📦 构建过程或辅助工具的变动
- [ ] 📝 文档内容更新
## 关联的Issue
无
## 如何测试
1. 执行全量编译:
bash build.sh -j8
2. 执行 adump UT:
bash tests/build_ut.sh -j8 --ut=adump
3. 使能L0 exception dump,构造硬件故障(返回对应的错误码),不dump数据。
## 核对清单
- [x] 我的代码遵循了项目的代码风格
- [x] 我已对代码进行了自测
- [ ] 我已更新了相关的文档
- [x] 我在标题中使用了合适的类型标签(如:feat:, fix:)
- [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等
## 其他信息
当前跟RTS对齐的错误码,其他错误码或故障场景暂不处理。
See merge request: cann/runtime!2616 | 1 天前 |