Star166
158
代码介绍
代码
Issues117
Pull Requests87
流水线
Actions
讨论
Wiki
项目成员86
分析
项目设置
Star166
158
  1. mind-cluster
  2. /
  3. component
  4. /
  5. clusterd
  6. /
  7. pkg
  8. /
  9. application
  10. /
  11. recover
ascend-robotascend-robot[clusterd]pod添加时更新controller originPod缓存
e775011e创建于 4月1日历史提交
文件最后提交记录最后更新时间
controller.go
【clusterD】fault job info cm资源更新优化3 个月前
controller2_test.go
【MindCluster】 Atlas 350 标卡适配产品形态和芯片改名3 个月前
controller_test.go
【修改说明】【ClusterD】Ascend950进程级重调度重构,通过判断被调度的pod向TaskD报告故障进程4 个月前
fault_recover_platform_plugin.go
【修改说明】进程级在线恢复、进程级重调度-part17 个月前
fault_recover_platform_plugin_test.go
【修改说明】进程级在线恢复、进程级重调度-part17 个月前
fault_recover_service.go
[clusterd]pod添加时更新controller originPod缓存2 个月前
fault_recover_service_test.go
[clusterd]pod添加时更新controller originPod缓存2 个月前
hot_switch_controller.go
clusterd: 补充dt8 个月前
hot_switch_controller_test.go
clusterd: 增加dt8 个月前
main_test.go
!980 【修改说明】支持主动借轨 -- 第三部分1 年前
om_controller.go
【修改说明】clusterd兼容elastic9 个月前
om_controller_test.go
【noded】【dp】【clusterd】冗余代码清理9 个月前
om_service.go
【修改说明】支持压测故障检测9 个月前
om_service_test.go
【修改说明】支持压测故障检测9 个月前
rules.go
【clusterD】软硬件故障重调度优化4 个月前
rules_test.go
【修改说明】修改rank 0所在DP域故障缩容失败未下发退出问题9 个月前