总体介绍
简介
MindStudio Monitor(msMonitor)是面向昇腾集群场景的在线性能监测与动态采集工具, 基于dynolog和msPTI构建,支持npu-monitor、nputrace和Monitor API等能力。
支持的框架Profiler工具:Ascend PyTorch Profiler和MindSpore Profiler

如上图所示msMonitor核心组件如下:
| 组件 | 作用 | 文档 |
|---|---|---|
Dynolog daemon |
服务端守护进程,负责接收dyno请求并触发监测与采集。 | dynolog |
Dyno CLI |
客户端命令行入口,用于下发npu-monitor和nputrace命令。 |
dyno |
MSPTI Monitor |
基于msPTI的采集模块,负责获取并上报性能数据。 | - |
功能介绍
msMonitor提供以下核心功能:
| 功能名称 | 功能简介 | 文档 |
|---|---|---|
| npu-monitor | 轻量常驻后台,持续监测关键算子耗时,适合在线观察性能波动。 | npu-monitor |
| nputrace | 动态触发框架、CANN和Device侧性能数据采集与解析,无需中断任务运行。 | nputrace |
| Monitor API | 提供Python接口,采集计算类算子、通信类算子、API、Runtime API、Mstx等性能数据。 | Monitor API |
Note
由于底层资源限制,npu-monitor与nputrace不能同时开启。