| 【clusterD】fault job info cm资源更新优化 | 3 个月前 |
| 【MindCluster】 Atlas 350 标卡适配产品形态和芯片改名 | 3 个月前 |
| 【修改说明】【ClusterD】Ascend950进程级重调度重构,通过判断被调度的pod向TaskD报告故障进程 | 4 个月前 |
| 【修改说明】进程级在线恢复、进程级重调度-part1 | 7 个月前 |
| 【修改说明】进程级在线恢复、进程级重调度-part1 | 7 个月前 |
| [clusterd]pod添加时更新controller originPod缓存 | 2 个月前 |
| [clusterd]pod添加时更新controller originPod缓存 | 2 个月前 |
| clusterd: 补充dt | 8 个月前 |
| clusterd: 增加dt | 8 个月前 |
| !980 【修改说明】支持主动借轨 -- 第三部分 | 1 年前 |
| 【修改说明】clusterd兼容elastic | 9 个月前 |
| 【noded】【dp】【clusterd】冗余代码清理 | 9 个月前 |
| 【修改说明】支持压测故障检测 | 9 个月前 |
| 【修改说明】支持压测故障检测 | 9 个月前 |
| 【clusterD】软硬件故障重调度优化 | 4 个月前 |
| 【修改说明】修改rank 0所在DP域故障缩容失败未下发退出问题 | 9 个月前 |