PrintTimeStamp
产品支持情况
功能说明
提供时间戳打点功能,用于在算子Kernel代码中标记关键执行点。调用后会打印如下信息:
- descId:用户自定义标识符,用于区分不同打点位置;
- rsv :保留值,默认为0,无需关注;
- timeStamp :当前系统cycle数,用于计算时间差,时间换算规则可参考GetSystemCycle(ISASI);
- pcPtr:pc指针数值,若无特殊需求,用户无需关注。
- entry:预留字段,用户无需关注。
打印示例如下:
descId is 65577, rsv is 0, timeStamp is 13806084506158, pcPtr is 20619064414544, entry is 0.
注意
该功能主要用于调试和性能分析,开启后会对算子性能产生一定影响,生产环境建议关闭。 默认情况下,该功能关闭,开发者可以按需通过增加-DASCENDC_TIME_STAMP_ON编译选项的方式,开启打点功能。
函数原型
__aicore__ inline void PrintTimeStamp(uint32_t descId)
参数说明
返回值说明
无
约束说明
-
该功能仅用于NPU上板调试。
-
暂不支持算子入图场景的打印。
-
单次调用本接口打印的数据总量不可超过1MB(还包括少量框架需要的头尾信息,通常可忽略)。使用时应注意,如果超出这个限制,则数据不会被打印。在使用自定义算子工程进行工程化算子开发时,一个算子所有使用Dump功能的接口在每个核上Dump的数据总量不可超过1MB。请开发者自行控制待打印的内容数据量,超出则不会打印。
调用示例
AscendC::PrintTimeStamp(65577);
打印结果如下(Dump信息头等仅在使用自定义算子工程时才会打印):
opType=AddCustom, DumpHead: AIV-0, CoreType=AIV, block dim=8, total_block_num=8, block_remain_len=1047136, block_initial_space=1048576, rsv=0, magic=5aa5bccd
...// 一些框架内部的打点信息
descId is 65577, rsv is 0, timeStamp is 13806084506158, pcPtr is 20619064414544, entry is 0.