torch_npu.profiler.profiler.analyse
产品支持情况
| 产品 | 是否支持 |
|---|---|
| Atlas A3 训练系列产品 | √ |
| Atlas A2 训练系列产品 | √ |
| Atlas 训练系列产品 | √ |
功能说明
提供对Ascend PyTorch Profiler采集的性能数据进行离线解析的功能。
函数原型
torch_npu.profiler.profiler.analyse(profiler_path="", max_process_number=max_process_number, export_type=export_type)
参数说明
-
profiler_path (
str):必选参数,PyTorch性能数据路径。路径格式仅支持由字母、数字和下划线组成的字符串,不支持软链接。指定的目录下保存PyTorch性能数据目录{worker_name}_{时间戳}_ascend_pt。 -
max_process_number (
int):可选参数,离线解析最大进程数。取值范围为1~CPU核数,默认为CPU核数的一半。若设置超过该环境的CPU核数,则自动取CPU核数;若设置为非法值,则取默认值CPU核数的一半。 -
export_type (
list):可选参数,设置导出的性能数据结果文件格式。取值为:- text:表示解析为.json和.csv格式的timeline和summary文件以及汇总所有性能数据的.db格式文件(ascend_pytorch.db、analysis.db)。
- db:表示仅解析为一个汇总所有性能数据的.db格式文件(ascend_pytorch.db、analysis.db),使用MindStudio Insight工具展示。仅支持on_trace_ready接口导出和离线解析导出,需配套安装支持导出db格式的Toolkit软件包。
设置无效值或未配置时,则读取profiler_info.json中的export_type字段,确定导出格式。
返回值说明
无
调用示例
以下是关键步骤的代码示例,不可直接拷贝编译运行,仅供参考。
创建_{file_name}.py文件,{file_name}_自定义,并编辑如下代码:
from torch_npu.profiler.profiler import analyse
if __name__ == "__main__":
analyse(profiler_path="./result_data", max_process_number=max_process_number)