文件最后提交记录最后更新时间
【msmodelslim】路径检查屏蔽对root用户的属主检查 Co-authored-by: SuperMeixc<meixiaocun1@huawei.com> 5 个月前
【msmodelslim】【feature】增加v3.2 w8a8-quarot最佳实践 Co-authored-by: zhangz200102<zhangzheng183@huawei.com> 5 个月前
docs:文档doc tools检查问题清零 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> 2 个月前
【docs】:定期检查低错修改;readme格式修改 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> 1 个月前
【docs】: 低错格式修改,增加简介文件 Co-authored-by: zhengzhimin60116158<zhengzhimin1@h-partners.com> 2 个月前
【msmodelslim】【feature】增加v3.2 w8a8-quarot最佳实践 Co-authored-by: zhangz200102<zhangzheng183@huawei.com> 5 个月前
add modelslim 1 年前
add set_up.py 1 年前
msit/msmodelslim更新为木兰版权头 Co-authored-by: LeeQT<liqitong@huawei.com> 3 个月前
【msmodelslim】【安全】修改日志中的不安全项 Co-authored-by: 李明宇<limingyu35@h-partners.com> 8 个月前
【msmodelslim】路径检查屏蔽对root用户的属主检查 Co-authored-by: SuperMeixc<meixiaocun1@huawei.com> 5 个月前
【docs】: 低错格式修改,增加简介文件 Co-authored-by: zhengzhimin60116158<zhengzhimin1@h-partners.com> 2 个月前
msit/msmodelslim更新为木兰版权头 Co-authored-by: LeeQT<liqitong@huawei.com> 3 个月前
【docs】: 低错格式修改,增加简介文件 Co-authored-by: zhengzhimin60116158<zhengzhimin1@h-partners.com> 2 个月前
【msmodelslim】【安全】【bugfix】修复mtp safetensors文件校验和其余文件属主校验 Co-authored-by: xiaoheng181<eudemoniaxh@163.com> 7 个月前
【msModelSlim】【refactor】单测目录整体修正 Co-authored-by: joejoezhou<zhourongchen1@huawei.com> 5 个月前
【msModelSlim】【refactor】单测目录整体修正 Co-authored-by: joejoezhou<zhourongchen1@huawei.com> 5 个月前
msit/msmodelslim更新为木兰版权头 Co-authored-by: LeeQT<liqitong@huawei.com> 3 个月前
README.md

msModelSlim

🔥🔥🔥Latest News

2026年1月

2025年12月

2025年11月

  • 🚀 msModelSlim 模型适配支持插件化和配置注册,支持依赖预检

2025年10月

2025年9月

  • 🚀 msModelSlim 支持 DeepSeek-V3.2-Exp W8A8 量化,单卡64G显存,100G内存即可执行
  • 🚀 msModelSlim 现已解决Qwen3-235B-A22B在W8A8量化下频繁出现"游戏副本"等异常token的问题 Qwen3-MoE 量化推荐实践
  • 🚀 msModelSlim 支持DeepSeek R1 W4A8 per-channel 量化【Prototype】
  • 🤝 msModelSlim 支持大模型量化敏感层分析

2025年8月

注: Prototype特性未经过充分验证,可能存在不稳定和bug问题,beta表示非商用特性

msModelSlim简介

msModelSlim,全称MindStudio ModelSlim,昇腾模型压缩工具。

昇腾模型压缩工具,一个以加速为目标、压缩为技术、昇腾为根本的亲和压缩工具。包含量化和压缩等一系列推理优化技术,旨在加速大语言稠密模型、MoE模型、多模态理解模型、多模态生成模型等。

昇腾AI模型开发用户可以灵活调用Python API接口,适配算法和模型,完成精度性能调优,并支持导出不同格式模型,通过MindIE、vLLM Ascend等推理框架在昇腾AI处理器上运行。

安装指南

具体安装步骤请查看安装指南

快速入门

快速入门旨在帮助用户快速通过一键量化的方式完成大模型量化功能。

具体快速入门请查看快速入门

支持矩阵

支持矩阵旨在以表格形式呈现不同功能和模型已适配场景的情况。

具体支持矩阵请查看支持矩阵

功能指南

功能指南基于msModelSlim不同架构下的功能支持情况,提供功能使用说明和接口说明。

具体功能指南请查看功能指南

自主量化

面向需要将自有模型接入 msModelSlim 的开发者,提供自主将模型接入msModelSlim一键量化的指导。

具体模型接入指南请查看自主量化模型接入指南

案例集

案例集通过具体的文字说明和代码示例,以实际应用场景为基础,旨在指导用户快速熟悉特定场景下msModelSlim工具的使用,包括一些精度调优方法等,msModelSlim将持续完善案例集。

具体案例集请查看案例集

常见问题

相关FAQ请参考链接:FAQ

其他资源

免责声明

致msModelSlim使用者

  1. msModelSlim工具依赖的transformers、PyTorch等第三方开源软件,均由第三方社区提供和维护,因第三方开源软件导致的问题的修复依赖相关社区的贡献和反馈。您应理解,msModelSlim仓库不保证第三方开源软件本身的问题进行修复,也不保证会测试或纠正所有第三方开源软件的漏洞和错误。
  2. 在您使用msModelSlim工具时,工具通常会从硬盘中读取您从互联网所下载的模型权重(通过您提供的命令行参数或配置文件)。使用非可信的模型权重可能会导致未知的安全风险,建议您在使用工具前通过SHA256校验等方法,确保模型权重可信后再传递给工具。
  3. 出于安全性及权限最小化角度考虑,您不应以root等高权限账户使用msModelSlim工具,建议您使用普通用户权限安装执行。
    • 用户须自行保证最小权限原则(如禁止 other 用户可写,常见如禁止 666、777)。
    • 使用 msModelSlim 工具请确保执行用户的 umask 值大于等于 0027,否则会导致生成的量化模型数据所在目录和权限过大。
      • 若要查看 umask 的值,可执行命令:umask
      • 若要修改 umask 的值,可执行命令:umask 新的取值
    • 请确保原始模型数据存放和量化模型数据保存在不含软链接的当前用户目录下,否则可能会引起安全问题。

致数据集所有者

如果您不希望您的数据集在msModelSlim中的模型被提及,或希望更新msModelSlim中的模型关于您的数据集的描述,请在Gitcode提issue,msModelSlim将根据您的issue要求删除或更新您的数据集描述。衷心感谢您对msModelSlim的理解和贡献。

License声明

msModelSlim提供的模型,若其模型目录中包含License文件,则遵循该文件中的许可协议。若未包含License文件,则默认适用Apache 2.0许可证。

致谢

msModelSlim 由华为公司的下列部门及昇腾生态合作伙伴联合贡献:

华为公司:

  • 计算产品线
  • 2012实验室

感谢来自社区的每一个PR,欢迎贡献 msModelSlim 。