Star166
158
代码介绍
代码
Issues117
Pull Requests87
流水线
Actions
讨论
Wiki
项目成员86
分析
项目设置
Star166
158
  1. mind-cluster
  2. /
  3. component
  4. /
  5. clusterd
  6. /
  7. pkg
  8. /
  9. application
  10. /
  11. faultmanager
  12. /
  13. cmprocess
ascend-robotascend-robot【clusterd】对于mindie任务,不配置默认过滤故障码
3bf15390创建于 4月9日历史提交
文件最后提交记录最后更新时间
custom
【clusterd】对于mindie任务,不配置默认过滤故障码2 个月前
incrementfault
【clusterd】manual fault processor微重构3 个月前
manualfault
【clusterd】manual fault processor微重构3 个月前
preseparate
【修改说明】【clusterd】网络故障跳过预隔离处理4 个月前
publicfault
!1230 【device-plugin】【clusterd】【修改说明】修复获取Pod信息时由于annotation未更新,无法获取AscendReal数据导致两个pod调度到相同卡的问题10 个月前
recoverinplace
【clusterD】软硬件故障重调度优化4 个月前
retry
【修改说明】【clusterd】单进程恢复从retry processor中分离7 个月前
stresstest
【修改说明】支持压测故障检测9 个月前
uceaccompany
【noded】【clusterd】安全加固8 个月前
base_fault_center.go
[clusterd]fix:6 个月前
base_fault_center_test.go
clusterd: 增加dt8 个月前
device_fault_center.go
【clusterd】manual fault processor微重构3 个月前
dpu_fault_center.go
【clusterd】【修改说明】DPU断点续训clusterd组件7 个月前
node_fault_center.go
【修改说明 Modification】clusterd统一预隔离故障处理,灵衢亚健康故障不按预隔离故障处理6 个月前
switch_fault_center.go
【clusterD】支持按照故障码和级别自定义拦截故障 part1 重命名4 个月前