Star7
24
代码介绍
代码
Issues2
Pull Requests
流水线
Actions
讨论
Wiki
项目成员13
分析
项目设置
Star7
24
  1. docs
  2. /
  3. MindStudio
  4. /
  5. 26.0.0
  6. /
  7. menu
  8. /
  9. msmodelslim_memu.md
ascend-robotascend-robotupdate: 更新文件 msmodelslim_memu.md
c066fe6b创建于 4月28日历史提交

MindStudio ModelSlim

  • 快速入门

  • 安装指南

  • 模型支持列表

    • 大模型支持矩阵
  • 算法介绍

    • 算法总览

    • 离群值抑制算法

      • QuaRot
      • Smooth Quant
      • Iterative Smooth
      • Flex Smooth Quant
      • Flex AWQ SSZ
      • KV Smooth
      • Adapt Rotation
      • AWQ
    • 量化算法

      • AutoRound
      • FA3 Quant
      • Float Sparse
      • GPTQ
      • Histogram
      • KVCache Quant
      • LAOS (W4A4)
      • Linear Quant
      • MinMax
      • PDMIX
      • SSZ
    • 自动调优策略

      • Standing High
      • Standing High With Experience
  • 功能指南

    • 一键量化 (V1)
      • 使用指南
      • 量化结果说明
      • 组合处理器
    • 敏感层分析
      • 使用指南
    • 自动调优策略
      • 使用指南
      • 配置协议详解
  • 调试案例集

    • 精度调优案例
      • 量化精度调优指南
      • W8A8 精度调优策略
      • W8A16 精度调优策略
      • Qwen3-32B W8A8 调优案例
      • 稀疏量化精度调优案例
    • 权重转换与使用
      • 权重转换案例 (AutoAWQ/AutoGPTQ)
      • 权重在加速库/MindIE中的使用
  • 附录

    • 常见问题