amct/tests/amct_pytorch/testcase_python/configuration · CANN/amct - AtomGit

cann-robottest: 补充 retrain 配置与 kl_divergence 有效单元测试(#126 )

文件	最后提交记录	最后更新时间
distill_config_base	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	1 个月前
test_quant_calibration_config_base	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	1 个月前
utils	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	1 个月前
__init__.py	add amct_pytorch pkg Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: fujun19<ikX6KxGSevEwXSku7b7TnwyZ> # message auto-generated for no-merge-commit merge: !19 merge amct_pytorch into master add amct_pytorch pkg Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述新增amct_pytorch部分功能开源，包含数据与权重低比特量化、张量分解、模型部署优化（主要为算子融合）等功能 https://www.hiascend.com/document/detail/zh/canncommercial/850/devaids/amct/atlasamct_16_0001.html ## 如何测试 bash build.sh --pkg构建出包 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!19	4 个月前
test_check.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	1 个月前
test_config_base_checks.py	test: 补充 config/field/proto_config/files 单元测试提升覆盖率(#126) Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !134 merge test/coverage-phase1-config into master test: 补充 config/field/proto_config/files 单元测试提升覆盖率(#126) Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: 关联 Issue: #126（阶段 1：配置/校验类纯逻辑补测） ## 描述为 common/config 与 common/utils 的纯逻辑模块补充单元测试，覆盖现有集成测试未触达的校验分支、异常路径与类型转换边界。本 PR 仅新增测试文件，不改动任何业务代码。新增 5 个测试文件，共 95 个用例： - tests/.../utils/test_files.py（24）：files.py 路径/校验/dump 解析 — 63% -> 100% - tests/.../configuration/test_config_field_unit.py（27）：各 Field 子类 check 分支 — field.py 81% -> 92% - tests/.../configuration/test_config_base_unit.py + test_config_base_checks.py（32）：静态方法 + mock graph_querier 驱动的校验方法 — config_base.py 77% -> 88% - tests/.../configuration/test_proto_config_unit.py（12）：proto 解析静态方法 — proto_config.py 66% -> 72% 属于 Issue #126 阶段 1（配置/校验类纯逻辑补测）。 ## 如何测试在对齐 requirements.txt 版本的隔离环境（torch 2.7.1 / onnx 1.18.0 / onnxruntime 1.20.0 / transformers 5.5.4）下跑全量 UT： - 基线（补测前）：1911 passed, 2 skipped, 1 xfailed - 本 PR 后：2006 passed, 2 skipped, 1 xfailed（新增 95 个用例全部通过，零破坏） - 行覆盖率（相对 master 基线 83.79%）：-> 84.46%，净增 165 行覆盖 ## 文档更新无。 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [x] 其他，请描述：测试用例补充（test），提升 UT 覆盖率 See merge request: cann/amct!134	1 个月前
test_config_base_unit.py	test: 补充 config/field/proto_config/files 单元测试提升覆盖率(#126) Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !134 merge test/coverage-phase1-config into master test: 补充 config/field/proto_config/files 单元测试提升覆盖率(#126) Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: 关联 Issue: #126（阶段 1：配置/校验类纯逻辑补测） ## 描述为 common/config 与 common/utils 的纯逻辑模块补充单元测试，覆盖现有集成测试未触达的校验分支、异常路径与类型转换边界。本 PR 仅新增测试文件，不改动任何业务代码。新增 5 个测试文件，共 95 个用例： - tests/.../utils/test_files.py（24）：files.py 路径/校验/dump 解析 — 63% -> 100% - tests/.../configuration/test_config_field_unit.py（27）：各 Field 子类 check 分支 — field.py 81% -> 92% - tests/.../configuration/test_config_base_unit.py + test_config_base_checks.py（32）：静态方法 + mock graph_querier 驱动的校验方法 — config_base.py 77% -> 88% - tests/.../configuration/test_proto_config_unit.py（12）：proto 解析静态方法 — proto_config.py 66% -> 72% 属于 Issue #126 阶段 1（配置/校验类纯逻辑补测）。 ## 如何测试在对齐 requirements.txt 版本的隔离环境（torch 2.7.1 / onnx 1.18.0 / onnxruntime 1.20.0 / transformers 5.5.4）下跑全量 UT： - 基线（补测前）：1911 passed, 2 skipped, 1 xfailed - 本 PR 后：2006 passed, 2 skipped, 1 xfailed（新增 95 个用例全部通过，零破坏） - 行覆盖率（相对 master 基线 83.79%）：-> 84.46%，净增 165 行覆盖 ## 文档更新无。 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [x] 其他，请描述：测试用例补充（test），提升 UT 覆盖率 See merge request: cann/amct!134	1 个月前
test_config_field_unit.py	test: 补充 config/field/proto_config/files 单元测试提升覆盖率(#126) Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !134 merge test/coverage-phase1-config into master test: 补充 config/field/proto_config/files 单元测试提升覆盖率(#126) Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: 关联 Issue: #126（阶段 1：配置/校验类纯逻辑补测） ## 描述为 common/config 与 common/utils 的纯逻辑模块补充单元测试，覆盖现有集成测试未触达的校验分支、异常路径与类型转换边界。本 PR 仅新增测试文件，不改动任何业务代码。新增 5 个测试文件，共 95 个用例： - tests/.../utils/test_files.py（24）：files.py 路径/校验/dump 解析 — 63% -> 100% - tests/.../configuration/test_config_field_unit.py（27）：各 Field 子类 check 分支 — field.py 81% -> 92% - tests/.../configuration/test_config_base_unit.py + test_config_base_checks.py（32）：静态方法 + mock graph_querier 驱动的校验方法 — config_base.py 77% -> 88% - tests/.../configuration/test_proto_config_unit.py（12）：proto 解析静态方法 — proto_config.py 66% -> 72% 属于 Issue #126 阶段 1（配置/校验类纯逻辑补测）。 ## 如何测试在对齐 requirements.txt 版本的隔离环境（torch 2.7.1 / onnx 1.18.0 / onnxruntime 1.20.0 / transformers 5.5.4）下跑全量 UT： - 基线（补测前）：1911 passed, 2 skipped, 1 xfailed - 本 PR 后：2006 passed, 2 skipped, 1 xfailed（新增 95 个用例全部通过，零破坏） - 行覆盖率（相对 master 基线 83.79%）：-> 84.46%，净增 165 行覆盖 ## 文档更新无。 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [x] 其他，请描述：测试用例补充（test），提升 UT 覆盖率 See merge request: cann/amct!134	1 个月前
test_configuration.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	1 个月前
test_distill_config.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	1 个月前
test_retrain_config.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	1 个月前
test_retrain_config_base_unit.py	test: 补充 retrain 配置与 kl_divergence 有效单元测试(#126) Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !136 merge test/coverage-phase3a-config into master test: 补充 retrain 配置与 kl_divergence 有效单元测试(#126) Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: 关联 Issue: #126（阶段 3：有效用例收尾） ## 描述本 PR 为覆盖率提升工作的收尾批次。不以覆盖率行数为唯一目标，重在用例有效性——断言真实的业务/数值性质，而非 shape/None 凑数断言。仅新增测试文件，不改动业务代码。新增 3 个测试文件，共 43 个用例： - test_kl_divergence_unit.py（9 cases）：kl_divergence.py 16% -> 98%。断言 KL 量化的数值性质：scale 为正、scale*128 不超数据范围（饱和截断）、数据翻倍则 scale 翻倍（缩放线性）、per-channel 大尺度通道 scale 更大。 - test_retrain_field_unit.py（23 cases）：retrain_field.py 87% -> 90%。覆盖各 Field 子类的类型/范围/枚举/非法 key 边界校验。 - test_retrain_config_base_unit.py（11 cases）：retrain_config_base.py 82% -> 87%。覆盖 set_ability、get_supported_layers 的 qat/ptq 分支、create_default_config 异常路径。 ## 如何测试在对齐 requirements.txt 版本的隔离环境（torch 2.7.1 / onnx 1.18.0 / onnxruntime 1.20.0 / transformers 5.5.4）下跑全量 UT： - 新增 43 个用例全部通过，零破坏 - 全量：2141 passed, 2 skipped, 1 xfailed 已按 codecheck 规则自查无触发点。 ## 文档更新无。 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [x] 其他，请描述：测试用例补充（test），提升 UT 有效覆盖 See merge request: cann/amct!136	29 天前
test_retrain_field_unit.py	test: 补充 retrain 配置与 kl_divergence 有效单元测试(#126) Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !136 merge test/coverage-phase3a-config into master test: 补充 retrain 配置与 kl_divergence 有效单元测试(#126) Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: 关联 Issue: #126（阶段 3：有效用例收尾） ## 描述本 PR 为覆盖率提升工作的收尾批次。不以覆盖率行数为唯一目标，重在用例有效性——断言真实的业务/数值性质，而非 shape/None 凑数断言。仅新增测试文件，不改动业务代码。新增 3 个测试文件，共 43 个用例： - test_kl_divergence_unit.py（9 cases）：kl_divergence.py 16% -> 98%。断言 KL 量化的数值性质：scale 为正、scale*128 不超数据范围（饱和截断）、数据翻倍则 scale 翻倍（缩放线性）、per-channel 大尺度通道 scale 更大。 - test_retrain_field_unit.py（23 cases）：retrain_field.py 87% -> 90%。覆盖各 Field 子类的类型/范围/枚举/非法 key 边界校验。 - test_retrain_config_base_unit.py（11 cases）：retrain_config_base.py 82% -> 87%。覆盖 set_ability、get_supported_layers 的 qat/ptq 分支、create_default_config 异常路径。 ## 如何测试在对齐 requirements.txt 版本的隔离环境（torch 2.7.1 / onnx 1.18.0 / onnxruntime 1.20.0 / transformers 5.5.4）下跑全量 UT： - 新增 43 个用例全部通过，零破坏 - 全量：2141 passed, 2 skipped, 1 xfailed 已按 codecheck 规则自查无触发点。 ## 文档更新无。 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [x] 其他，请描述：测试用例补充（test），提升 UT 有效覆盖 See merge request: cann/amct!136	29 天前