总体介绍

简介

MindStudio Monitor(msMonitor)是面向昇腾集群场景的在线性能监测与动态采集工具, 基于dynologmsPTI构建,支持npu-monitornputraceMonitor API等能力。

支持的框架Profiler工具:Ascend PyTorch ProfilerMindSpore Profiler

msMonitor

如上图所示msMonitor核心组件如下:

组件 作用 文档
Dynolog daemon 服务端守护进程,负责接收dyno请求并触发监测与采集。 dynolog
Dyno CLI 客户端命令行入口,用于下发npu-monitornputrace命令。 dyno
MSPTI Monitor 基于msPTI的采集模块,负责获取并上报性能数据。 -

功能介绍

msMonitor提供以下核心功能:

功能名称 功能简介 文档
npu-monitor 轻量常驻后台,持续监测关键算子耗时,适合在线观察性能波动。 npu-monitor
nputrace 动态触发框架、CANN和Device侧性能数据采集与解析,无需中断任务运行。 nputrace
Monitor API 提供Python接口,采集计算类算子、通信类算子、API、Runtime API、Mstx等性能数据。 Monitor API

Note

由于底层资源限制,npu-monitornputrace不能同时开启。