MindStudio-Modeling:基于 PyTorch 的神经网络推理性能模拟与分析框架项目

MindStudio-Modeling(msmodeling)是MindStudio建模寻优工具,评估模型及服务化等场景下的理论性能,并在此基础上寻找性能较优的部署策略等参数。

Branch5Tags71
FilesLast commitLast update
优化 msModeling README 与中英文文档结构4 days ago
chore(ci): adopt pre-commit and retire legacy lintrunner adapters1 month ago
refactor(tensor_cast): unify word embedding tp config3 days ago
refactor(tensor_cast): unify word embedding tp config3 days ago
新增组合测试脚本run_throughput_optimizer_cases.py,组合多种设备 × 卡数 × 模型 × 输入/输出长度,输出总结csv,提升整体易用性4 days ago
feat: pipe pre-commit output through LLM renderer for compact diagnostics26 days ago
【REFACTOR】CI Gate 联合执行与 Nightly 流水线加固3 days ago
feat(tensor_cast): Organize serving_cast.main output structure5 days ago
refactor(tensor_cast): unify word embedding tp config3 days ago
refactor(tensor_cast): unify word embedding tp config3 days ago
【FEAT】MindStudio CLI 统一 stderr Logo6 days ago
绑定web_ui运行地址4 days ago
feat: profiling-based empirical performance model with CSV data source1 month ago
chore(test): add unit test runner script with coverage enforcement1 month ago
Add model adapter onboarding automation11 days ago
[feat] 添加SKILL:通过自然语言配置 device13 days ago
[feat] 添加SKILL:通过自然语言配置 device13 days ago
删除冗余目录5 months ago
【fix】修复文档链接与命令示例问题3 days ago
Refactor transformers folder layout9 months ago
【FIX】CI Gate 增量门禁加固:test_map 漏检修复、pytest 策略与 node 级豁免3 days ago
新增psutil模块3 days ago
【FIX】CI Gate 增量门禁加固:test_map 漏检修复、pytest 策略与 node 级豁免3 days ago

MindStudio Modeling

昇腾 AI 模型性能建模与仿真工具

快速入门 AI问答(DeepWiki) AI问答(ZRead) 精确搜索 昇腾社区 报告问题

✨ 最新消息

🔹 [2026.06.10]:msModeling 新增 DeepSeek-V4 模型支持
🔹 [2026.04.02]:msModeling 新增 GLM5 模型支持

ℹ️ 简介

MindStudio Modeling(msModeling)是专为昇腾 AI 处理器打造的神经网络推理性能仿真与分析框架,提供单模型性能仿真、服务级吞吐优化、服务化参数自动寻优与可视化分析能力,帮助开发者在无物理硬件或部署前期预测模型性能、识别瓶颈并优化配置。

⚙️ 功能介绍

msModeling 提供 TensorCast、Throughput Optimizer、ServingCast、Web UI 和 OptiX 等功能模块,覆盖单模型性能仿真、吞吐优化、服务级仿真、可视化交互与服务化参数自动寻优等场景。模型与特性覆盖范围请参见《模型支持与特性支持矩阵》。

功能名称 功能描述
TensorCast 算子仿真模块,拦截 PyTorch 计算图,在指定 DeviceProfile 上模拟推理过程,输出算子级性能分解、内存占用、算子 shape 及 Chrome Trace。
Throughput Optimizer 吞吐优化模块,在 SLO 约束下自动搜索最优并行策略与 batch 配置,支持 PD 混部、PD 分离、PD 配比三种模式。
ServingCast 服务级推理仿真模块,基于 YAML 配置模拟多实例、多请求的端到端 serving 场景,输出吞吐、TTFT、TPOT 等系统级指标。
Web UI 可视化交互界面,支持通过页面配置模型、芯片、并行、量化和 workload 参数,并查看曲线、表格和导出结果。
OptiX 服务化参数自动寻优工具,基于 PSO 粒子寻优算法对 vLLM、MindIE 等服务框架进行参数寻优与验证。

🚀 快速入门

以 TensorCast 单模型仿真与 ServingCast 服务仿真为例,快速跑通核心流程,请参见《TensorCast 与 ServingCast 快速入门》。

📦 安装指南

介绍工具的环境依赖与安装方法,请参见《msModeling 安装指南》。

📘 使用指南

各工具的详细使用说明请参阅其源码仓库中的 README 文件,也可通过上方功能介绍表格中的链接直接跳转。

💡 典型案例

通过典型问题场景帮助用户理解并掌握工具使用,请参见《吞吐优化指南》与《服务仿真指南》中的示例。

❓ FAQ

常见问题及解决方案,请提交 Issues 或参见各模块使用指南。

🌌 智能检索

为提升文档查阅效率,我们提供多种高效检索方式:
🔹 AI 问答(DeepWiki):自然语言问答,快速把握项目架构与模块关系。
🔹 AI 问答(ZRead):中文问答体验更优,精准定位功能用法与细节。
🔹 精确搜索(ReadTheDocs):关键词全文检索,直达接口、参数与报错等信息。

🛠️ 贡献指南

欢迎参与项目贡献。提交代码前请使用 pre-commit 保证代码风格一致,并确保相关单元测试通过。如有疑问,请提交 Issues

⚖️ 相关说明

🔹 《版本说明
🔹 《许可证声明
🔹 《安全声明
🔹 免责声明:本工具仿真与优化结果仅供性能评估参考,最终性能表现请以真实环境实测为准

🤝 建议与交流

欢迎大家为社区做贡献。如果有任何疑问或建议,请提交 Issues,我们会尽快回复。感谢您的支持。

SIG 例会:MindStudio Modeling Weekly Meeting 每周三 10:00-12:00(UTC+8)举行,会议纪要与议题请参见 sig-msit-modeling,也可使用 时区转换 查看本地时间。

即时互动(微信群) 官方资讯(公众号) 深度支持(助手/论坛)

扫码加入技术交流群

扫码关注官方公众号
扫码入群并关注公众号,直达 MindStudio 用户与开发者最快捷的交流平台:
快速提问: 与社区小伙伴即时探讨技术问题
掌握动态: 第一时间获取版本发布与功能更新通知
经验共享: 与广大开发者交流最佳实践与实战心得

更多支持渠道:👉 昇腾助手:WeChat 👉 昇腾论坛:Website

🙏 致谢

本工具由华为公司的下列部门联合贡献:
🔹 昇腾计算 MindStudio 开发部
🔹 昇腾计算生态使能部
感谢来自社区的每一个 PR,欢迎贡献!

Introduction

MindStudio-Modeling(msmodeling)是MindStudio建模寻优工具,评估模型及服务化等场景下的理论性能,并在此基础上寻找性能较优的部署策略等参数。

Customize my domain