msmodelslim/docs/en/feature_guide/traditional_quantization_v0 · Ascend/MindStudio-ModelSlim - AtomGit

文件	最后提交记录	最后更新时间
figures	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
onnx	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
README.md	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
fake_quantization_accuracy_testing_tool.md	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
foundation_model_compression.md	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
foundation_model_quantization_and_calibration.md	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
inference_optimization_for_multimodal_generative_model.md	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
mindspeed_adapter.md	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
pruning_and_distillation.md	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
quantization_and_sparse_quantization_scenario_import_code_examples.md	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
quantized_weight_format.md	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
sparse_acceleration_training.md	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
traditional_model_quantization_and_calibration.md	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前
traditional_quantization.md	【docs】：英文开源资料合入 Co-authored-by: zzm30<zhengzhimin1@h-partners.com> # message auto-generated for no-merge-commit merge: !437 merge master into master 【docs】：英文开源资料合入 Created-by: zzm30 Commit-by: zzm30 Merged-by: ascend-robot Description: 感谢您贡献的Pull Request！在提交之前，请务必阅读 [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md)。 Thanks for sending a pull request! BEFORE SUBMITTING, PLEASE READ [CONTRIBUTING.md](https://gitcode.com/Ascend/msmodelslim/blob/master/CONTRIBUTING.md). ## PR描述 (What this PR does / why we need it?) 1. 英文开源资料翻译回稿，需要合入开源社区，后进行链接和内容的校准。 See merge request: Ascend/msmodelslim!437	6 天前

The documents in this directory are organized by model type and task scenario to facilitate quick scanning.

1. Traditional Model Quantization and Calibration

Traditional Model Quantization and Calibration
- Includes post-training quantization (PTQ) and quantization-aware training (QAT) for PyTorch, ONNX, and MindSpore.

2. Foundation Model Quantization and Compression

Foundation Model Quantization and Compression
- Includes low-memory quantization, mixed calibration datasets, and FA3 quantization.
Compression and Structure Optimization (Mainly for Foundation Models)(foundation_model_compression.md)
- Includes sparse quantization, weight compression, long-sequence compression, and low-rank decomposition.

3. Training Acceleration and Model Reconstruction

Training Acceleration and Model Reconstruction
- Includes importance-based pruning, transformer model pruning, Sparse Tool description, and model distillation.
Sparse Training Acceleration
- Includes sparse training acceleration workflows for width-expanded and depth-expanded models.

4. Tool and Ecosystem Adaptation

Quantized Weight Format Description
- Includes descriptions of the quantized weight file and the weight description file, alongside dequantization formulas and KV Cache quantization specifications.
MindSpeed Adapter
- Includes MindSpeed-LLM model quantization adaptation workflows and examples.
Fake Quantization Accuracy Testing Tool
- Includes the usage and testing process of the Precision Tool.
Inference Optimization for Multimodal Generative Models
- Includes Diffusion Transformer (DiT) cache optimization and adaptive sampling optimization workflows.
Quantization Code Samples
- Includes code samples for common quantization and sparse quantization scenarios.

V0 Framework and Traditional Model Documentation Navigation (Evolution Stopped)

1. Traditional Model Quantization and Calibration

2. Foundation Model Quantization and Compression

3. Training Acceleration and Model Reconstruction

4. Tool and Ecosystem Adaptation