Star164
153
代码介绍
代码
Issues109
Pull Requests78
流水线
Actions
讨论
Wiki
项目成员75
分析
项目设置
Star164
153
  1. mind-cluster
  2. /
  3. component
ascend-robotascend-robot[mindio acp] libingAI工具扫描问题修改
b4ee6a55创建于 刚刚历史提交
文件最后提交记录最后更新时间
ascend-common
device-plugin启动与NPU复位后主动查询上报UBOE状态1 天前
ascend-device-plugin
修复打印serverIndex乱码的错误5 小时前
ascend-docker-runtime
<feat>【ascend-common/device-plugin/volcano/ascend-docker-runtime/npu-exporter/ascend-operator/infer-operator/noded】节点配置易用性优化12 天前
ascend-faultdiag-online
[FD][Fix] Do not close grpc connection20 小时前
ascend-faultdiag
[FD][Feat] Add new kg_config3 小时前
ascend-for-volcano
<feat>[volcano]多级调度支持调度到历史节点22 小时前
ascend-operator
<feat>[ascend-common/device-plugin/operator/clusterd/infer-opreator/noded/npu-exporter]添加健康探针检查服务公共代码8 天前
clusterd
【Device-plugin】【Volcano】【clusterd】删除DPU相关代码2 天前
container-manager
[container-manager]部署脚本校验sock路径必须存在23 天前
infer-operator
bugfix:workload调谐失败不更新scalingstatus5 天前
k8s-rdma-shared-dev-plugin
补资料,重构启动函数,打开rdma设备的名字参数供后续故障检测使用6 小时前
mindio
[mindio acp] libingAI工具扫描问题修改刚刚
noded
<feat>[ascend-common/device-plugin/operator/clusterd/infer-opreator/noded/npu-exporter]添加健康探针检查服务公共代码8 天前
npu-exporter
[npu-exporter]:支持采集周期按分组配置;支持动态加载配置-PR323 小时前
taskd
【taskd】 clusterd和taskd的kill master协同问题13 天前