TORCH_NPU_LOGS

功能描述

此环境变量用于配置Ascend Extension for PyTorch新增模块的日志打印功能,为开发者在debugging场景下提供精准的调试定位能力。

Ascend Extension for PyTorch新增的模块不支持通过原生TORCH_LOGS进行设置,如需设置新增模块的日志信息,需要使用TORCH_NPU_LOGS,新增模块列表如下:

字段名 对应模块 功能描述
memory 内存管理 打印内存相关日志
dispatch 算子下发 打印算子下发相关日志
dispatch_time 算子下发时间 打印算子下发时间日志
silent 静默检测 打印静默检测相关日志
recovery 进程级在线恢复 打印进程级在线恢复相关日志
op_plugin 算子适配 打印算子适配相关日志
shmem 共享内存 打印共享内存相关日志
env 环境变量 打印调用环境变量日志
acl acl 打印acl相关日志
aclgraph aclgraph 打印aclgraph相关日志

Ascend Extension for PyTorch对原生的logging日志打印功能进行了增强,支持C++侧的日志打印功能。

  • 配置时,开启logging日志信息打印,指定模块的日志信息会正常打印在首节点的屏幕上。
  • 未配置时,关闭logging日志信息打印,日志信息不会打印在屏幕上。

此环境变量默认未配置。

配置示例

  • 开启logging日志信息打印:

    export TORCH_NPU_LOGS=memory,+dispatch,-all
    

    级别说明:

    • :INFO级别,默认级别,输出常规运行信息。

    • +:DEBUG级别,输出最详细的调试信息。

    • -:ERROR级别,仅输出错误和警告信息。

    以上配置示例表示memory(内存管理)打印INFO级别日志,dispatch(算子下发)打印DEBUG级别日志,all(其余所有模块包含原生PyTorch和Ascend Extension for PyTorch新增模块)打印ERROR级别日志信息。

  • 关闭logging日志信息打印:

    unset TORCH_NPU_LOGS
    

使用约束

shmem模块仅在PyTorch2.7.1及以上版本生效。

支持的型号

  • Atlas 训练系列产品
  • Atlas A2 训练系列产品
  • Atlas A3 训练系列产品
  • Atlas 800I A2 推理产品
  • Atlas 推理系列产品