MindStudio-Modeling(msmodeling)是MindStudio建模寻优工具,评估模型及服务化等场景下的理论性能,并在此基础上寻找性能较优的部署策略等参数。
MindStudio Modeling
✨ 最新消息
🔹 [2026.06.10]:msModeling 新增 DeepSeek-V4 模型支持
🔹 [2026.04.02]:msModeling 新增 GLM5 模型支持
ℹ️ 简介
MindStudio Modeling(msModeling)是专为昇腾 AI 处理器打造的神经网络推理性能仿真与分析框架,提供单模型性能仿真、服务级吞吐优化、服务化参数自动寻优与可视化分析能力,帮助开发者在无物理硬件或部署前期预测模型性能、识别瓶颈并优化配置。
⚙️ 功能介绍
msModeling 提供 TensorCast、Throughput Optimizer、ServingCast、Web UI 和 OptiX 等功能模块,覆盖单模型性能仿真、吞吐优化、服务级仿真、可视化交互与服务化参数自动寻优等场景。模型与特性覆盖范围请参见《模型支持与特性支持矩阵》。
| 功能名称 | 功能描述 |
|---|---|
| TensorCast | 算子仿真模块,拦截 PyTorch 计算图,在指定 DeviceProfile 上模拟推理过程,输出算子级性能分解、内存占用、算子 shape 及 Chrome Trace。 |
| Throughput Optimizer | 吞吐优化模块,在 SLO 约束下自动搜索最优并行策略与 batch 配置,支持 PD 混部、PD 分离、PD 配比三种模式。 |
| ServingCast | 服务级推理仿真模块,基于 YAML 配置模拟多实例、多请求的端到端 serving 场景,输出吞吐、TTFT、TPOT 等系统级指标。 |
| Web UI | 可视化交互界面,支持通过页面配置模型、芯片、并行、量化和 workload 参数,并查看曲线、表格和导出结果。 |
| OptiX | 服务化参数自动寻优工具,基于 PSO 粒子寻优算法对 vLLM、MindIE 等服务框架进行参数寻优与验证。 |
🚀 快速入门
以 TensorCast 单模型仿真与 ServingCast 服务仿真为例,快速跑通核心流程,请参见《TensorCast 与 ServingCast 快速入门》。
📦 安装指南
介绍工具的环境依赖与安装方法,请参见《msModeling 安装指南》。
📘 使用指南
各工具的详细使用说明请参阅其源码仓库中的 README 文件,也可通过上方功能介绍表格中的链接直接跳转。
💡 典型案例
通过典型问题场景帮助用户理解并掌握工具使用,请参见《吞吐优化指南》与《服务仿真指南》中的示例。
❓ FAQ
常见问题及解决方案,请提交 Issues 或参见各模块使用指南。
🌌 智能检索
为提升文档查阅效率,我们提供多种高效检索方式:
🔹 AI 问答(DeepWiki):自然语言问答,快速把握项目架构与模块关系。
🔹 AI 问答(ZRead):中文问答体验更优,精准定位功能用法与细节。
🔹 精确搜索(ReadTheDocs):关键词全文检索,直达接口、参数与报错等信息。
🛠️ 贡献指南
欢迎参与项目贡献。提交代码前请使用 pre-commit 保证代码风格一致,并确保相关单元测试通过。如有疑问,请提交 Issues。
⚖️ 相关说明
🔹 《版本说明》
🔹 《许可证声明》
🔹 《安全声明》
🔹 免责声明:本工具仿真与优化结果仅供性能评估参考,最终性能表现请以真实环境实测为准
🤝 建议与交流
欢迎大家为社区做贡献。如果有任何疑问或建议,请提交 Issues,我们会尽快回复。感谢您的支持。
SIG 例会:MindStudio Modeling Weekly Meeting 每周三 10:00-12:00(UTC+8)举行,会议纪要与议题请参见 sig-msit-modeling,也可使用 时区转换 查看本地时间。
| 即时互动(微信群) | 官方资讯(公众号) | 深度支持(助手/论坛) |
|---|---|---|
![]() 扫码加入技术交流群 |
![]() 扫码关注官方公众号 |
扫码入群并关注公众号,直达 MindStudio 用户与开发者最快捷的交流平台: 快速提问: 与社区小伙伴即时探讨技术问题 掌握动态: 第一时间获取版本发布与功能更新通知 经验共享: 与广大开发者交流最佳实践与实战心得 更多支持渠道:👉 昇腾助手: |
🙏 致谢
本工具由华为公司的下列部门联合贡献:
🔹 昇腾计算 MindStudio 开发部
🔹 昇腾计算生态使能部
感谢来自社区的每一个 PR,欢迎贡献!
Introduction
MindStudio-Modeling(msmodeling)是MindStudio建模寻优工具,评估模型及服务化等场景下的理论性能,并在此基础上寻找性能较优的部署策略等参数。
Customize my domain
