| 【docs】资料架构重构,并将资料托管至readthedocs。
Co-authored-by: keith_wa<keith_wwa@163.com>
# message auto-generated for no-merge-commit merge:
!109 merge pr_docs_re_copy into master
【docs】资料架构重构,并将资料托管至readthedocs。
Created-by: keith_wa
Commit-by: keith_wa
Merged-by: ascend-robot
Description: 1. 动机 (Motivation)
内容上:
优化导航结构:原目录结构逻辑不清晰、目录层级深且链接复杂。
提升阅读体验:原 traditional_quantization_v0 目录下存在 20+ 个零散文档,内容分布碎片化,用户难以快速建立完整的技术全景认知。
消除内容冗余:多个文档之间存在重复的依赖说明、操作流程及参数介绍,增加了维护成本及版本不一致的风险。
呈现上:
提供专业资料托管:原docs/目录结构不清晰、目录名/文档名不直观(英文),跳转繁琐且无搜索功能。
2. 修改点 (Changes)
2.1 重新梳理目录结构

2.2. 文档整合与重构
V0及传统量化核心文档合并:将 20 多个零散文档按功能维度深度整合为 10篇核心指南:
# V0框架文档导航(已停止演进)
本目录文档按模型类型与任务场景重排,便于按需求快速定位。
## 一、传统模型量化与校准
- [传统模型量化与校准](traditional_model_quantization_and_calibration.md)
- 包含 PyTorch/ONNX/MindSpore 训练后量化与 QAT。
## 二、大模型量化与压缩
- [大模型量化与校准](foundation_model_quantization_and_calibration.md)
- 包含低显存量化、混合校准数据集、FA3 量化。
- [压缩与结构优化(大模型为主)](foundation_model_compression.md)
- 包含稀疏量化与权重压缩、长序列压缩、权重压缩流程、低秩分解。
## 三、训练加速与模型改造
- [训练加速与模型改造](pruning_and_distillation.md)
- 包含重要性剪枝、Transformer 剪枝、Sparse tool、模型蒸馏。
- [稀疏加速训练](sparse_acceleration_training.md)
- 包含宽度扩增与深度扩增模型的稀疏训练加速流程。
## 四、工具与生态适配
- [辅助工具与专项指导](compression_utils.md)
- 包含量化权重格式说明与 MindSpeed 适配器。
- [伪量化精度测试工具](fake_quantization_accuracy_testing_tool.md)
- 包含 Precision Tool 使用方式与测试流程。
- [多模态生成模型推理优化](inference_optimization_for_multimodal_generative_model.md)
- 包含 DiT 缓存优化与自适应采样优化流程。
- [常见代码示例](quantization_and_sparse_quantization_scenario_import_code_examples.md)
- 包含常见量化/稀疏量化场景导入代码样例。
2.3 配置readthedocs文档托管:
https://modelslim.readthedocs.io/zh-cn/latest/
2.4 配置deepwiki:
https://deepwiki.com/Keithwwa/ModelSlim
3. 验证:
3.1. gimini代码检视:
https://github.com/Keithwwa/ModelSlim/pull/1
See merge request: Ascend/msmodelslim!109 | 3 个月前 |