mstt:基于昇腾平台的训练工具链项目

针对训练&大模型场景,提供端到端命令行&可视化调试调优工具,帮助用户快速提高模型开发效率。

分支30Tags111
文件最后提交记录最后更新时间
update: 更新文件 PULL_REQUEST_TEMPLATE.zh-CN.md Signed-off-by: yao-xiaobai <17625331900@163.com>8 个月前
mstt中debug目录日落公告 Co-authored-by: wugengjun<wugengjun1@huawei.com> 2 个月前
dosc:资料描述优化 Co-authored-by: cai-weiwei1989<734267852@qq.com> 14 天前
【Doc】分析迁移资料调整 Co-authored-by: luyq11<luyiqian4@h-partners.com> 1 个月前
[Doc]: tb-graph-ascend插件资料章节编号不一致且格式不统一 Co-authored-by: sun-cha<1299792067@qq.com> 1 个月前
mstt pre-commit 配置文件 Co-authored-by: wangchao285<wangchao285@huawei.com> 28 天前
docs: 资料大模型检查修改和issue问题修改 Co-authored-by: cai-weiwei1989<734267852@qq.com> 1 个月前
【bugfix】分析迁移打包支持传入指定版本号 Co-authored-by: l30036321<lvkaimeng@huawei.com> 1 个月前
msinsight添加至mstt,作为子仓 Co-authored-by: xiaoy2459<xiaoyao126@huawei.com> 4 个月前
[ADD] Add msmemscope as submodule Co-authored-by: tanxiangyuu<tanxiangyu2@huawei.com> 4 个月前
add msmonitor submodule Co-authored-by: hehongzhe<935062458@qq.com> 4 个月前
支持分析迁移工具打包至mstt Co-authored-by: wangchao285<wangchao285@huawei.com> 4 个月前
add submodule Co-authored-by: hehongzhe<935062458@qq.com> 4 个月前
add submodule Co-authored-by: hehongzhe<935062458@qq.com> 4 个月前
add submodule Co-authored-by: hehongzhe<935062458@qq.com> 4 个月前
【tinker】新增MindSpeed-LLM 2.3.0适配 Co-authored-by: wangqian67<wangq67@chinatelecom.cn> 1 个月前
add msmonitor submodule Co-authored-by: hehongzhe<935062458@qq.com> 4 个月前
mstt pre-commit 配置文件 Co-authored-by: wangchao285<wangchao285@huawei.com> 28 天前
修改license和版权头为木兰 Co-authored-by: wugengjun<wugengjun1@huawei.com> 3 个月前
update OWNERS. 添加新的评审人员 Signed-off-by: uniteone <lan_tx@126.com>1 年前
docs:mstt安装指南删除后对应README描述修改 Co-authored-by: cai-weiwei1989<734267852@qq.com> 25 天前
update Third_Party_Open_Source_Software_Notice. Signed-off-by: 188******92 <1324355112@qq.com>2 年前

MindStudio Training Tools

昇腾 AI 训练开发工具链

Ascend License

✨ 最新消息

🔹 [2026.03.28]:精度调试模块(debug 目录)正式日落下线,详情请参见 公告
🔹 [2026.02.25]:Tinker 并行策略自动寻优系统正式开源,详情请参见 Tinker 项目
🔹 [2026.01.12]:本仓库许可证(License)变更,详情请参见 公告
🔹 [2025.12.31]:MindStudio 训练开发工具链全面开源

ℹ️ 简介

MindStudio Training Tools(msTT)训练开发工具链,聚焦训练开发中的关键挑战。通过提供分析迁移、精度调试与性能调优三大核心工具,高效应对迁移受阻、Loss 异常、性能不达标等问题,助力实现精度与性能双优的极简开发体验。

⚙️ 功能介绍

训练开发工具链提供以下系列化工具:

类别 工具名称 功能简介
迁移 msTransplant 【分析迁移】 PyTorch 训练脚本一键迁移至昇腾 NPU,支持少量改码或零改码完成迁移。
精度 msProbe 【精度调试】 昇腾全场景精度工具,用于训练精度调试与问题定位。
精度 TensorBoard 【分级可视】 分级展示模型结构与精度,支持调试与标杆模型对比以定位精度问题。
性能 msProf 【模型调优】 全场景性能调优底座,采集 CANN 与 NPU 数据,提升设备调优效率。
性能 msprof-analyze 【性能分析】 基于采集数据做性能分析,快速识别性能瓶颈。
性能 msMemScope 【内存调优】 内存调优专用工具:整网级多维度内存采集,支持自动诊断与优化分析。
性能 msInsight 【可视调优】 可视化性能分析,覆盖系统、算子、服务化等场景,辅助完成性能诊断。
性能 Tinker 【并行寻优】 大模型并行策略自动寻优:按训练脚本做单节点 NPU 测评并推荐高性能并行方案。
性能 bind_core 【一键绑核】 CPU 绑核工具,无需侵入修改工程即可按 CPU 亲和性策略绑核。
性能 msPTI 【性能剖析】 面向昇腾的 Profiling API,可据此开发 NPU 应用性能分析工具。
监控 msMonitor 【在线监控】 一站式监控,支持落盘与在线采集,面向集群的监测与问题定位。

🚀 快速入门

面向 PyTorch 与 MindSpore 场景,通过可执行样例串联迁移分析、精度调试与性能调优,助力用户快速上手端到端训练优化。

训练框架 快速入门指南
PyTorch PyTorch 场景 msTT 工具快速入门
MindSpore MindSpore 场景 msTT 工具快速入门

📦 安装指南

各工具的安装指南请参阅其源码仓库中的安装指南,可通过上方功能介绍表格中的链接跳转跳转到源码仓后进入 docs/zh 目录找到对应的 install_guide 文档。

📘 使用指南

各工具的详细使用说明请参阅其源码仓库中的 README,也可通过上方功能介绍表格中的链接直接跳转。

🛠️ 贡献指南

欢迎参与项目贡献,请参见 《贡献指南》。

⚖️ 相关说明

🔹 《版本说明
🔹 《许可证声明
🔹 《安全声明
🔹 《免责声明

🤝 建议与交流

欢迎大家为社区做贡献。如果有任何疑问或建议,请提交 Issues,我们会尽快回复。感谢您的支持。

📱 关注 MindStudio 公众号 💬 更多交流与支持

扫码关注获取最新动态
💡 加入微信交流群
关注公众号,回复“交流群”即可获取入群二维码。

🛠️ 其他渠道
👉 昇腾助手:WeChat
👉 昇腾论坛:Website

🙏 致谢

msTT 由华为公司的下列部门联合贡献:
🔹 昇腾计算MindStudio开发部
🔹 昇腾计算生态使能部
🔹 华为云昇腾云服务
🔹 2012分布式并行计算实验室
🔹 2012网络技术实验室
感谢来自社区的每一个 PR,欢迎贡献 msTT!

项目介绍

针对训练&大模型场景,提供端到端命令行&可视化调试调优工具,帮助用户快速提高模型开发效率。

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新

语言类型

Python86.36%
Jupyter Notebook5.63%
C++3.45%
TypeScript3.02%
Shell0.74%