1_launch_kernel_with_reslimit
描述
本样例展示在当前进程设置 Device 资源限制后执行 Kernel 的基础流程。样例设置 Cube Core 资源限制,查询当前限制值,并下发打印 Kernel;运行后可以看到 Kernel 输出的 Hello World 日志和脚本校验结果。
产品支持情况
本样例支持以下产品:
| 产品 | 是否支持 |
|---|---|
| Ascend 950PR/Ascend 950DT | √ |
| Atlas A3 训练系列产品/Atlas A3 推理系列产品 | √ |
| Atlas A2 训练系列产品/Atlas A2 推理系列产品 | √ |
编译运行
- 下载样例代码至安装 CANN 软件的环境,切换到样例目录。
cd ${git_clone_path}/example/2_advanced_features/kernel/1_launch_kernel_with_reslimit
- 设置环境变量。
# ${install_root} 替换为 CANN 安装根目录,默认安装在 /usr/local/Ascend 目录
source ${install_root}/cann/set_env.sh
export ASCEND_INSTALL_PATH=${install_root}/cann
# ${ascend_name} 替换为昇腾 AI 处理器型号,可通过 npu-smi info 查看 Name 字段并去掉空格获得
export SOC_VERSION=${ascend_name}
# ${cmake_path} 替换为 ascendc.cmake 所在目录,例如 ${install_root}/cann/aarch64-linux/tikcpp/ascendc_kernel_cmake
export ASCENDC_CMAKE_DIR=${cmake_path}
如果未提前设置环境变量,run.sh 会自动尝试探测 ASCEND_INSTALL_PATH、ASCEND_HOME_PATH、$HOME/Ascend/cann、/usr/local/Ascend/cann、/opt/Ascend/cann、SOC_VERSION 和 ASCENDC_CMAKE_DIR;如果自动探测失败,请按上述命令手动设置。
- 执行以下命令运行样例。
bash run.sh
CANN RUNTIME API
在该Sample中,涉及的关键功能点及其关键接口,如下所示:
- 初始化
- 调用
aclInit接口进行初始化配置。 - 调用
aclFinalize接口实现去初始化。
- 调用
- Device 管理
- 调用
aclrtSetDevice接口指定用于运算的 Device。 - 调用
aclrtResetDeviceForce接口强制复位当前运算的 Device,回收 Device 上的资源。
- 调用
- Stream 管理
- 调用
aclrtCreateStream接口创建 Stream。 - 调用
aclrtSynchronizeStream接口阻塞等待 Stream 上任务执行完成。 - 调用
aclrtDestroyStreamForce接口强制销毁 Stream。
- 调用
- 运行时配置
- 调用
aclrtSetDeviceResLimit接口设置当前进程的 Device 资源限制。 - 调用
aclrtGetDeviceResLimit接口获取当前进程的 Device 资源限制。
- 调用
示例输出
[INFO]: Current compile soc version is ...
Configuring CMake...
Building...
[INFO] ACL initialized.
[INFO] Device 0 selected.
[INFO] Stream created.
[INFO] Device resource limit type 0 set to 8.
[INFO] Current device resource limit type 0 is 8.
Hello World
Hello World
Hello World
Hello World
Hello World
Hello World
Hello World
Hello World
[INFO] Run the launch_kernel_with_reslimit sample successfully.
[SUCCESS]: Launch kernels under resource limits successfully.