MindStudio Service Profiler
📢 最新消息
- [2026.03.24] 支持 Prometheus 在线监测。
- [2025.12.30] 支持Torch Profiler数据采集与解析。
- [2025.11.30] 对接 OpenTelemetry 生态,支持全链路 Trace 追踪。
- [2025.11.24] 支持 vLLM 框架的无侵入自动插桩采集。
- [2025.11.07] 发布自动寻优插件化模式。
📌 简介
MindStudio Service Profiler 是一款专为大模型推理服务设计的全栈性能分析与调优工具。它通过无侵入式采集、高性能数据持久化及多维关联分析,帮助用户深入洞察推理框架(如 MindIE, vLLM, SGLang)在昇腾硬件上的运行表现,精准定位性能瓶颈。
🔍 目录结构
关键目录如下,详细目录介绍参见项目目录。
├─docs # 文档目录
├─include # 采集能力对外接口目录
├─ms_service_profiler # 基础能力目录(解析、数据比对等),python源码主目录
│ ├─tracer/ # Trace数据监测能力目录
│ ├─patcher/ # vLLM、SGLang服务化调优能力目录
├─msservice_advisor/ # 专家建议工具目录
├─ms_serviceparam_optimizer/ # 自动寻优工具目录
├─ms_service_metric/ # 在线监测工具目录
└── cpp # 基础能力目录(采集),C++源码主目录
└─test # 测试目录
工具安装
安装msServiceProfiler工具,详情请参见《msServiceProfiler工具安装指南》。
🚀 快速入门
msServiceProfiler服务化调优工具的快速入门,包括必要的操作步骤、参数说明等,具体请参见快速入门。
📖 功能介绍
面向不同使用场景,建议按照以下顺序快速体验本工具:
-
服务化性能调优:详细理解服务化调优数据格式、可视化分析方式及典型调优流程,参见服务化调优工具。
-
vLLM / SGLang 场景专项采集:如只关注某一框架,可直接参考对应服务化性能采集工具使用指南:
-
Trace 数据链路监测(MindIE 场景):需要将服务端请求链路打通到 Jaeger 等 OTLP 生态时,参见Trace数据监测工具。
-
Prometheus 在线监测(vLLM 场景):如需在 vLLM-Ascend 上结合 Prometheus 做在线监控,参见vLLM 服务化 Prometheus 数据监测工具使用指南。Prometheus、Grafana 为第三方开源软件,不属于 MindStudio 产品发布包的组成部分,用户可根据实际环境选择其他兼容的监控、可视化方案;如使用 Prometheus,请使用安全版本并完成必要的安全加固。
-
采集数据的比对与多维分析:对不同版本/配置的性能结果做对比或从多维度深入分析时,参见:
-
自动寻优与专家建议(进阶能力):在已有采集数据基础上进行参数自动寻优或获取专家建议时,参见:
📝 相关说明
💬 建议与交流
欢迎大家为社区做贡献。如果有任何疑问或建议,请提交Issues,我们会尽快回复。感谢您的支持。
| 📱 关注 MindStudio 公众号 | 💬 更多交流与支持 |
|---|---|
![]() 扫码关注获取最新动态 |
💡 加入微信交流群: 关注公众号,回复“交流群”即可获取入群二维码。 🛠️ 其他渠道: 👉 昇腾助手: 👉 昇腾论坛: |
🤝 致谢
msServiceProfiler由华为公司的下列部门联合贡献:
- 昇腾计算MindStudio开发部
感谢来自社区的每一个PR,欢迎贡献msServiceProfiler!
关于MindStudio团队
华为MindStudio全流程开发工具链团队致力于提供端到端的昇腾AI应用开发解决方案,使能开发者高效完成训练开发、更多信息请访问 昇腾社区 和 昇腾论坛。
