| 文件 | 最后提交记录 | 最后更新时间 |
|---|---|---|
[fix] 修复preseparatenpu故障等级的处理逻辑问题,新增subhealthy故障等级映射。 Co-authored-by: 吕有辉<lvyouhui@huawei.com> # message auto-generated for no-merge-commit merge: !327 merge fault_code into master [fix] 修复preseparatenpu故障等级的处理逻辑问题,新增subhealthy故障等级映射。 Created-by: codeDogPro Commit-by: 吕有辉 Merged-by: towncharlie Description: ## **1. 合入背景** https://gitcode.com/Ascend/MindIE-PyMotor/issues/208 ## **2. 修改内容** 预隔离故障不影响当前的推理业务,根据是否有实例处在这个节点上来分配这个故障类型的故障等级。 ## **3. 资料变更** 涉及 ## **4. 接口变更** 不涉及 ## **5. 测试结果** 预隔离故障已修复问题   PreSeparateNPU故障现在会在该节点有实例使用时降级为L2故障,不做隔离和其他策略。 ## **6. CheckList** > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] [ ] 代码注释完备 [ ] 正确记录维测日志 [ ] 是否有UT用例 [ ] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!327 | 6 天前 | |
[fix] 修复preseparatenpu故障等级的处理逻辑问题,新增subhealthy故障等级映射。 Co-authored-by: 吕有辉<lvyouhui@huawei.com> # message auto-generated for no-merge-commit merge: !327 merge fault_code into master [fix] 修复preseparatenpu故障等级的处理逻辑问题,新增subhealthy故障等级映射。 Created-by: codeDogPro Commit-by: 吕有辉 Merged-by: towncharlie Description: ## **1. 合入背景** https://gitcode.com/Ascend/MindIE-PyMotor/issues/208 ## **2. 修改内容** 预隔离故障不影响当前的推理业务,根据是否有实例处在这个节点上来分配这个故障类型的故障等级。 ## **3. 资料变更** 涉及 ## **4. 接口变更** 不涉及 ## **5. 测试结果** 预隔离故障已修复问题   PreSeparateNPU故障现在会在该节点有实例使用时降级为L2故障,不做隔离和其他策略。 ## **6. CheckList** > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] [ ] 代码注释完备 [ ] 正确记录维测日志 [ ] 是否有UT用例 [ ] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!327 | 6 天前 | |
[fix] 修复preseparatenpu故障等级的处理逻辑问题,新增subhealthy故障等级映射。 Co-authored-by: 吕有辉<lvyouhui@huawei.com> # message auto-generated for no-merge-commit merge: !327 merge fault_code into master [fix] 修复preseparatenpu故障等级的处理逻辑问题,新增subhealthy故障等级映射。 Created-by: codeDogPro Commit-by: 吕有辉 Merged-by: towncharlie Description: ## **1. 合入背景** https://gitcode.com/Ascend/MindIE-PyMotor/issues/208 ## **2. 修改内容** 预隔离故障不影响当前的推理业务,根据是否有实例处在这个节点上来分配这个故障类型的故障等级。 ## **3. 资料变更** 涉及 ## **4. 接口变更** 不涉及 ## **5. 测试结果** 预隔离故障已修复问题   PreSeparateNPU故障现在会在该节点有实例使用时降级为L2故障,不做隔离和其他策略。 ## **6. CheckList** > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] [ ] 代码注释完备 [ ] 正确记录维测日志 [ ] 是否有UT用例 [ ] 若涉及多线程场景,考虑了并发场景,不存在死锁问题 See merge request: Ascend/MindIE-PyMotor!327 | 6 天前 |
| 文件 | 最后提交记录 | 最后更新时间 |
|---|---|---|
| 6 天前 | ||
| 6 天前 | ||
| 6 天前 |