0
代码介绍
代码
Issues
Pull Requests
流水线
Actions
讨论
Wiki
项目成员
分析
项目设置
0
  1. pytorch
  2. /
  3. docs
  4. /
  5. zh
  6. /
  7. troubleshooting
  8. /
  9. menu_troubleshooting.md
ascend-robotascend-robotmodify document
0ee4980c创建于 4月13日历史提交

故障处理

  • 故障处理流程

  • Error Code介绍

    • 使用说明
    • ERR**001
    • ERR**002
    • ERR**003
    • ERR**004
    • ERR**005
    • ERR**006
    • ERR**007
    • ERR**008
    • ERR**009
    • ERR**010
    • ERR**011
    • ERR**012
    • ERR**100
    • ERR**200
    • ERR**300
    • ERR**999
  • 报错信息分析指导

    • 报错信息分析说明

    • 报错信息分类

      • 回显信息
      • plog日志信息
    • 报错信息分析

    • coredump问题定位

  • 故障案例集

    • 通信算子传入非连续tensor
    • 调用算子参数校验失败
    • 分布式任务端口号被占用
    • 用于梯度计算的变量被inplace操作
    • 调用不支持的算子
    • HCCL超时
    • 算子调用报错
    • 初始化报错
    • 通信域建链超时