amct/tests/amct_pytorch · CANN/amct - AtomGit

cann-robotfix: 适配int8*int4 npu算子并将fp8/hif8 bias传入算子

文件	最后提交记录	最后更新时间
testcase_python	fix: 接通文档承诺的公开导入路径，保证文档示例可直接运行 Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !162 merge fix/doc-auto-calibration-import into master fix: 接通文档承诺的公开导入路径，保证文档示例可直接运行 Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述文档（README + 各 API 页）给出的多条公开导入路径在代码中并未接通：真实实现深埋在 `amct_pytorch/classic/graph_based/amct_pytorch/...` 下，而文档给的是简短公开路径，用户照文档 `import` 即报 `ModuleNotFoundError`。以文档用法为准补建公开转发模块（均指向健康实现，不改动任何在用逻辑）。每条修复对应的文档出处如下： ### 1. `amct_pytorch.common.auto_calibration`（`AutoCalibrationEvaluatorBase` 等 6 个基类）新建 `amct_pytorch/common/auto_calibration/`，接通以下文档用法： - `docs/README.md:114` —— `from amct_pytorch.common.auto_calibration import AutoCalibrationEvaluatorBase` - `docs/zh/api/accuracy_based_auto_calibration.md:140` —— 同上（自定义 evaluator 继承基类做基于精度的自动量化） ### 2. `amct_pytorch.nn.module.quantization.`（5 个 QAT 类）新建 `amct_pytorch/nn/module/quantization/` 三层包 + 5 个转发子模块，接通： - `docs/README.md:641-642, 695` —— `Conv2dQAT` / `LinearQAT` - `docs/zh/api/Conv2dQAT.md:23,29,223,235` —— `Conv2dQAT` - `docs/zh/api/Conv3dQAT.md:25,31,227` —— `Conv3dQAT` - `docs/zh/api/ConvTranspose2dQAT.md` —— `ConvTranspose2dQAT` - `docs/zh/api/LinearQAT.md` —— `LinearQAT` - `docs/zh/api/QuantCalibrationOp.md` —— `QuantCalibrationOp` ### 3. `amct_pytorch.tensor_decompose`（`auto_decomposition` / `decompose_network`）新建 `amct_pytorch/tensor_decompose/`，接通： - `docs/README.md:1912,1924,1937` —— `auto_decomposition` / `decompose_network` - `docs/zh/api/auto_decomposition.md:71` —— `from amct_pytorch.tensor_decompose import auto_decomposition` - `docs/zh/api/decompose_network.md:68` —— `from amct_pytorch.tensor_decompose import decompose_network` ### 4. `amct_pytorch.common.auto_channel_prune`（`SensitivityBase` / `SearchChannelBase`）新建 `amct_pytorch/common/auto_channel_prune/` 指向健康实现，并修正 README 笔误： - `docs/README.md:1023` —— `amct.common.auto_channel_prune.sensitivity_base` → `amct_pytorch.common.auto_channel_prune.sensitivity_base`（包名 `amct`→`amct_pytorch`） - `docs/README.md:1040` —— `amct.common.auto_prune.search_channel_base` → `amct_pytorch.common.auto_channel_prune.search_channel_base`（包名修正 + 目录名 `auto_prune`→`auto_channel_prune`） - `docs/README.md:1037` —— prose 中默认实现路径 `auto_prune` → `auto_channel_prune` 同步修正 ## 如何测试隔离环境（torch 2.7.1 + NPU）实测： - 文档全部 10 条 `amct_pytorch` 导入语句逐条按原文执行通过 - 顶层 25 个 `amct.` API 仍全部可达（新增包未破坏现有导入） - `setuptools.find_packages()` 可发现 6 个新建转发包，打包进 wheel 不会遗漏 ## 文档更新修正 `docs/README.md`：`amct`→`amct_pytorch`、`auto_prune`→`auto_channel_prune`（共 3 处，含 1 处 prose 路径）。其余 API 页（accuracy_based_auto_calibration / Conv2dQAT / Conv3dQAT / ConvTranspose2dQAT / LinearQAT / QuantCalibrationOp / auto_decomposition / decompose_network）一字未改，靠新增转发模块接通。 ## 类型标签 - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!162	11 天前
.coveragerc	add coverage report Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !76 merge master into master add coverage report Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述补充bash build.sh -u --cov覆盖率报告输出 ## 如何测试 bash build.sh -u --cov，输出覆盖率报告 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!76	2 个月前
CMakeLists.txt	build: use cann third party protobuf Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !124 merge fix/use-add-cann-third-party into master build: use cann third party protobuf Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: 关联 Issue：#121 ## 描述将本仓 protobuf 三方依赖迁移到 cann-cmake 统一入口： - 使用 `add_cann_third_party(protobuf)` 替换本地 `cmake/third_party/protobuf.cmake`。 - 开启 `ENABLE_OPEN_SRC`，确保统一 protobuf 脚本创建 `host_protoc`、`ascend_protobuf_static` 等目标。 - 将 proto 编译路径从旧的 `build/protobuf_host/bin/protoc` 切换为 `$<TARGET_FILE:host_protoc>`。 - 删除迁移后不再需要的本地 protobuf 脚本和 patch 文件。 ## 如何测试 - `git diff --check` - `cmake -S . -B build_add_cann_third_party_default_check -DENABLE_TEST=OFF` - `cmake -S . -B build_add_cann_third_party_test_check -DENABLE_TEST=ON` 说明：`ENABLE_TEST=ON` 配置过程中当前环境会打印已有的 `torch_npu` 后端符号错误 traceback，但 CMake 退出码为 0 并完成配置生成。 ## 文档更新不涉及文档更新。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [x] 其他，请描述：构建依赖迁移 See merge request: cann/amct!124	28 天前
mock_torch_npu.py	fix: 适配int8int4 npu算子并将fp8/hif8 bias传入算子 Co-authored-by: annqr<qiuqianru@h-partners.com> # message auto-generated for no-merge-commit merge: !157 merge fix/a8w4-int4pack-and-bias into master fix: 适配int8int4 npu算子并将fp8/hif8 bias传入算子 Created-by: annqr Commit-by: annqr Merged-by: cann-robot Description: ## 描述修复 NpuQuantizationLinear 部署算子的两个问题： 1. *int8int4 算子适配*：`npu_quant_matmul` 在 int8int4 场景下要求 x2_dtype 为 `torch_npu.int4`，且 quantized_weight 需为 int8 数据类型（由 int4 权重沿 cout 维每两个元素打包成一个字节，shape 为 [k, n//2]）。新增 `_pack_int4_to_int8` 实现打包，并在 `_init_npu_quantize_type` 中为 INT4 权重设置 x2_dtype。 2. *fp8fp8 / hif8hif8 bias 传入算子：算子现已支持这两种场景直接传入 bias，因此将 bias 改为传入 `npu_quant_matmul`，不再在算子外部相加。 ## 如何测试 - 在 NPU 环境下运行 int8int4 量化部署，验证 npu_quant_matmul 正确接收 int8 打包权重与 int4 x2_dtype。 - 验证 fp8fp8 / hif8hif8 场景 bias 经算子内部相加后结果正确。 - 单元验证：int4 打包逻辑（含负数补码、奇数 cout 拦截）round-trip 正确。 ## 文档更新无。 ## 类型标签 - [x] Bug修复 See merge request: cann/amct!157	11 天前
test_awq.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_cast.py	feat: HiFloat8 cast support in calibration Co-authored-by: yaoguangxiu<yaoguangxiu@huawei.com> # message auto-generated for no-merge-commit merge: !147 merge fakequant into master feat: HiFloat8 cast support in calibration Created-by: yaoguangxiu Commit-by: yaoguangxiu Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 环境中没有hifloat8支持的场景，回退使用amct_ops/hifloat8_cast算子进行仿真计算 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 没有hifloat8支持的场景，安装amct_ops包，执行量化校准，得到仿真模型，使用仿真模型进行精度测试 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!147	16 天前
test_config.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_customized_algo.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_data_util.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_deepseekv3_attention.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_fake_quant_forward.py	add fake quant forward and INT8 PER_TENSOR bias quantization Co-authored-by: qiuqianru<qiuqianru@h-partners.com> # message auto-generated for no-merge-commit merge: !130 merge feature/fake-quant-forward-v2 into master add fake quant forward and INT8 PER_TENSOR bias quantization Created-by: annqr Commit-by: qiuqianru Merged-by: cann-robot Description: ## 描述 1. fakequant功能经过 batch_num 轮校准后，各校准模块的 forward() 用校准得到的 scale 做 quant→dequant，从而复现量化误差。 2. bias量化 ## 如何测试对quantize接口的校准模型校准次数大于batch_num次 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!130	28 天前
test_flatquant.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_fp8linear_to_hif8linear.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_fuzzy_matching.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_gptq.py	feat: HiFloat8 cast support in calibration Co-authored-by: yaoguangxiu<yaoguangxiu@huawei.com> # message auto-generated for no-merge-commit merge: !147 merge fakequant into master feat: HiFloat8 cast support in calibration Created-by: yaoguangxiu Commit-by: yaoguangxiu Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 环境中没有hifloat8支持的场景，回退使用amct_ops/hifloat8_cast算子进行仿真计算 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 没有hifloat8支持的场景，安装amct_ops包，执行量化校准，得到仿真模型，使用仿真模型进行精度测试 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!147	16 天前
test_hifloat8_fallback.py	feat: HiFloat8 cast support in calibration Co-authored-by: yaoguangxiu<yaoguangxiu@huawei.com> # message auto-generated for no-merge-commit merge: !147 merge fakequant into master feat: HiFloat8 cast support in calibration Created-by: yaoguangxiu Commit-by: yaoguangxiu Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 环境中没有hifloat8支持的场景，回退使用amct_ops/hifloat8_cast算子进行仿真计算 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 没有hifloat8支持的场景，安装amct_ops包，执行量化校准，得到仿真模型，使用仿真模型进行精度测试 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> 不涉及 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!147	16 天前
test_longcat_attention.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_minmax.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_mxquant.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_ofmr.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_quantile.py	fix: SmoothQuant INT8 per-token fix (#139) Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !160 merge fix/issue-139-smoothquant-pertoken into master fix: SmoothQuant INT8 per-token fix (#139) Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述修复 SmoothQuant INT8 per-token 激活量化（`inputs.strategy='token'`）在 `convert()` 部署后推理报错的问题。关联 issue #139。根因：per-token 激活量化的 scale 维度等于 token 数（batch × seqlen），每次输入都在变化，本质上必须运行时动态计算。但 INT8 per-token 此前走的是静态路径——校准期 `SmoothQuant._calculate_per_token_params` 算出的 `scale_d` 长度绑定到校准 seqlen，部署期 `NpuQuantizationLinear.forward` 用此定长 scale 调 `npu_quantize(x, act_scale, axis=-2)`，推理 seqlen 与校准不同时 scale 的 token 维与 x 不匹配，触发 `aclnnAscendQuantV3` 报错（`scale dim value invalid, should be same as x dim or 1`）。运行时动态量化分支 `npu_dynamic_quant` 此前仅对 `act_type == HIFLOAT8` 开放，INT8 per-token 进不去。改动：让 `NpuQuantizationLinear.forward` 中所有 `act_granularity == 'token'` 路径统一走运行时 `npu_dynamic_quant` 计算 per-token scale（HIF8 保留 `dst_type_max=15`，INT8 用默认），并把运行时 `pertoken_scale` 喂给 `npu_quant_matmul`。per-tensor 静态路径保持不变。仅改动 `amct_pytorch/classic/deploy_op/npu_quantization_linear.py` 一处。 ## 如何测试在 Ascend910 + Qwen2.5-0.5B-Instruct 上，使用上报的精确配置（weights=tensor int8 / inputs=token int8 / smoothquant 0.77 / skip lm_head+down_proj），且校准 seqlen(256) 故意不同于推理 seqlen(2048) 以触发原 bug： - 修复前：PPL 推理阶段抛 `npu_quantize ... scale dim ... invalid`（已复现）。 - 修复后：端到端跑通，PPL 22.05。 - 回归：`inputs=tensor` 的 per-tensor 静态路径仍正常，PPL 22.25，未受影响。 - 单元验证：INT8 `npu_dynamic_quant` + 每通道权重 `npu_quant_matmul` 相对误差 0.84%。 ## 文档更新无。 ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： related #139 See merge request: cann/amct!160	16 天前
test_quantize.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前
test_smoothquant.py	fix: SmoothQuant INT8 per-token fix (#139) Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !160 merge fix/issue-139-smoothquant-pertoken into master fix: SmoothQuant INT8 per-token fix (#139) Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述修复 SmoothQuant INT8 per-token 激活量化（`inputs.strategy='token'`）在 `convert()` 部署后推理报错的问题。关联 issue #139。根因：per-token 激活量化的 scale 维度等于 token 数（batch × seqlen），每次输入都在变化，本质上必须运行时动态计算。但 INT8 per-token 此前走的是静态路径——校准期 `SmoothQuant._calculate_per_token_params` 算出的 `scale_d` 长度绑定到校准 seqlen，部署期 `NpuQuantizationLinear.forward` 用此定长 scale 调 `npu_quantize(x, act_scale, axis=-2)`，推理 seqlen 与校准不同时 scale 的 token 维与 x 不匹配，触发 `aclnnAscendQuantV3` 报错（`scale dim value invalid, should be same as x dim or 1`）。运行时动态量化分支 `npu_dynamic_quant` 此前仅对 `act_type == HIFLOAT8` 开放，INT8 per-token 进不去。改动：让 `NpuQuantizationLinear.forward` 中所有 `act_granularity == 'token'` 路径统一走运行时 `npu_dynamic_quant` 计算 per-token scale（HIF8 保留 `dst_type_max=15`，INT8 用默认），并把运行时 `pertoken_scale` 喂给 `npu_quant_matmul`。per-tensor 静态路径保持不变。仅改动 `amct_pytorch/classic/deploy_op/npu_quantization_linear.py` 一处。 ## 如何测试在 Ascend910 + Qwen2.5-0.5B-Instruct 上，使用上报的精确配置（weights=tensor int8 / inputs=token int8 / smoothquant 0.77 / skip lm_head+down_proj），且校准 seqlen(256) 故意不同于推理 seqlen(2048) 以触发原 bug： - 修复前：PPL 推理阶段抛 `npu_quantize ... scale dim ... invalid`（已复现）。 - 修复后：端到端跑通，PPL 22.05。 - 回归：`inputs=tensor` 的 per-tensor 静态路径仍正常，PPL 22.25，未受影响。 - 单元验证：INT8 `npu_dynamic_quant` + 每通道权重 `npu_quant_matmul` 相对误差 0.84%。 ## 文档更新无。 ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： related #139 See merge request: cann/amct!160	16 天前
utils.py	[feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块，用于面向大语言模型的后训练量化、精度评估和部署产物导出，主要包括： 1. 新增并整理 LLM 量化工作流能力 - 新增 `amct_pytorch/workflows` 与 `amct_pytorch/cli/llm`，覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 `algorithms`、`common`、`quantization`、`workflows` 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 `amct_pytorch/classic/graph_based`，保持历史能力可用。 - 修正安装包数据路径，确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - `build.sh -u` 默认开启覆盖率采集。 - 新增 `pyproject.toml`，统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口，使用 pytest 执行 `tests/unit_test` 与 `tests/amct_pytorch`。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖，如 `datasets`、`accelerate`、`compressed_tensors`、`torchao`、`einops` 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例，包括 Qwen3.6-MoE、DeepSeek-V4 Flash，以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 `examples/algorithms` 目录，提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证： 1. UT 与覆盖率验证 `bash build.sh -u` 结果： 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> - 更新根目录 `README.md`，补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口，并修正 `amct_ops` 文档链接。 - 更新 `docs/AMCT_Pytorch_LLM.md`，补充 LLM 量化流程说明，包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 `docs/algorithm_brief.md`，同步当前支持的量化算法说明。 - 更新 `docs/context/ptq_config_param.md`，修正配置示例引用路径，避免文档中的样例路径不可用。 - 更新 `docs/quick_install.md` 与 `docs/README.md`，同步依赖安装、构建验证和特性说明。 - 更新 `examples/README.md`，重新整理样例入口，明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档，降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!102	30 天前