Star
164
Fork
153
代码
介绍
代码
Issues
114
Pull Requests
78
流水线
Actions
讨论
Wiki
项目成员
82
分析
项目设置
Star
164
Fork
153
branch_v26.0.0
mind-cluster
/
docs
/
zh
/
scheduling
/
usage
/
resumable_training
/
menu_resumable_training.md
下载
ascend-robot
【docs】拆分集群调度MD文件;修改版本说明书评审意见;修改集群调度资料评审问题;修改资料格式问题,主要是增加加粗标记和没有导航栏问题;修改产品名称
9d4a8a74
创建于
4月23日
历史提交
断点续训特性指南
特性说明
方案和原理
准备K8s和共享存储
(可选)配置故障检测级别
配置故障处理
配置训练恢复
配置任务YAML
通过命令行使用