CPU Debug直调样例说明
概述
本样例以 Add 计算为载体,重点演示 Ascend C CPU Debug 功能的使用流程,包括 CPU 域编译、可执行程序运行、通过 GDB 进入调试模式,以及在核函数中设置断点、单步执行和查看变量。样例用于帮助开发者在不依赖 NPU 运行的情况下,对 Ascend C 核函数逻辑进行本地调试和问题定位。
本样例支持的产品及CANN软件版本
| 产品 | CANN软件版本 |
|---|---|
| Ascend 950PR/Ascend 950DT | >= CANN 9.1.0 |
| Atlas A3 训练系列产品/Atlas A3 推理系列产品 | >= CANN 9.0.0 |
| Atlas A2 训练系列产品/Atlas A2 推理系列产品 | >= CANN 9.0.0 |
目录结构介绍
├── 06_cpu_debug
│ ├── CMakeLists.txt // 编译工程文件
│ ├── cpu_debug.asc // Ascend C样例实现 & 调用样例
│ └── README.md // 样例说明文档
样例描述
-
CPU Debug介绍:
CPU Debug功能支持对CPU执行过程中的运行状态进行调试,主要通过GDB工具实现。GDB调试支持设置断点、查看寄存器和内存状态、单步执行、查看调用栈等常用调试操作。 -
样例介绍:
本样例的Add实现与Add基础样例保持一致,默认使用float类型。每个block处理2048个数据,流程为DataCopy输入到UB、执行Add、再将结果DataCopy回GM。为了使能CPU Debug,本样例在定义
ASCENDC_CPU_DEBUG宏时包含cpu_debug_launch.h头文件。#ifdef ASCENDC_CPU_DEBUG #include "cpu_debug_launch.h" #endifcpu_debug_launch.h提供CPU域下的核函数启动支持,使样例可以通过CPU Debug方式运行并配合GDB调试。
编译运行
在本样例根目录下执行如下步骤,编译并执行样例。
-
配置环境变量
请根据当前环境上CANN开发套件包的安装方式,配置环境变量。source ${install_path}/cann/set_env.sh说明:
${install_path}为CANN包安装目录,未指定安装目录时默认安装至/usr/local/Ascend下。 -
样例执行
在本样例目录下执行如下命令。
mkdir -p build && cd build; cmake -DCMAKE_ASC_RUN_MODE=cpu -DCMAKE_ASC_ARCHITECTURES=dav-2201 ..;make -j; ./cpu_debug请根据实际测试的 NPU 硬件架构选择对应的
CMAKE_ASC_ARCHITECTURES参数- 编译选项说明
选项 说明 CMAKE_ASC_RUN_MODE指定为 cpu, 开启CPU域编译CMAKE_ASC_ARCHITECTURES指定NPU架构版本号,CMake会根据该值配置对应的CPU调试依赖库。 dav-2201对应 Atlas A2 训练系列产品/Atlas A2 推理系列产品和Atlas A3 训练系列产品/Atlas A3 推理系列产品,dav-3510对应 Ascend 950PR/Ascend 950DT
- 编译选项说明
-
执行结果
执行结果如下,说明执行成功。[Success] Case accuracy is verification passed. -
进入gdb模式调试
说明: 需使用 GDB 12.1及以上版本。
编译生成的CPU域可执行程序支持通过gdb进行调试。gdb支持设置断点、查看寄存器和内存状态、单步执行、查看调用栈等常用调试操作。在上述指令中"./cpu_debug"前加入"gdb --args",再次执行指令即可进入gdb模式。
gdb --args ./cpu_debugCPU Debug通过为每个核函数启动单独的子进程来模拟NPU的执行逻辑,因此使用gdb调试时,需要设置
follow-fork-mode让gdb跟踪子进程,才能在核函数内部断点调试。进入gdb后,先设置跟踪子进程模式:(gdb) set follow-fork-mode child然后按需进行调试,常用操作:
# 在核函数入口处设置断点 (gdb) break add_custom # 运行程序 (gdb) run # 单步执行 (gdb) next # 继续执行到下一个断点 (gdb) continue