1_msproftx
描述
本样例展示了使用 msproftx 扩展接口采集并落盘性能数据。除了瞬时事件 aclprofMark 外,还补充演示了 aclprofPush / aclprofPop 的嵌套范围标记,以及 aclprofRangeStart / aclprofRangeStop 的非嵌套范围标记,便于对照 NVTX 的常见使用模式。
产品支持情况
本样例支持以下产品:
| 产品 | 是否支持 |
|---|---|
| Atlas A3 训练系列产品/Atlas A3 推理系列产品 | √ |
| Atlas A2 训练系列产品/Atlas A2 推理系列产品 | √ |
编译运行
环境安装详情以及运行详情请见 example 目录下的 README。
运行步骤如下:
# ${install_root} 替换为 CANN 安装根目录,默认安装在`/usr/local/Ascend`目录
source ${install_root}/cann/set_env.sh
export ASCEND_INSTALL_PATH=${install_root}/cann
# Profiling 样例的 run.sh 还会读取 ASCEND_HOME_PATH,请一并设置为同一路径
export ASCEND_HOME_PATH=${install_root}/cann
# 编译运行
bash run.sh
CANN RUNTIME API
在本样例中,涉及的关键功能点及其关键接口如下所示:
- msproftx 标记对象管理
- 调用
aclprofCreateStamp接口创建 msproftx 事件标记对象。 - 调用
aclprofSetStampTraceMessage接口为标记对象设置可读字符串描述。 - 调用
aclprofDestroyStamp接口释放标记对象。
- 调用
- 事件与范围标记
- 调用
aclprofMark接口记录瞬时事件。 - 调用
aclprofPush和aclprofPop接口记录嵌套范围。 - 调用
aclprofRangeStart和aclprofRangeStop接口记录非嵌套范围。
- 调用
已知issue
暂无。