| feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架(.agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 2 天前 |
| docs: add English translation for all markdown documentation files Co-authored-by: sophia1213<sophie.chen@huawei.com> # message auto-generated for no-merge-commit merge: !143 merge master into master docs: add English translation for all markdown documentation files Created-by: sophia1213 Commit-by: sophia1213 Merged-by: cann-robot Description: ## 描述 更新英文非产品文档资料 ## 如何测试 根据最新的中文md资料进行测试 ## 文档更新 非docs目录下的所有xx_en.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!143 | 22 天前 |
| docs: add English translation for all markdown documentation files Co-authored-by: sophia1213<sophie.chen@huawei.com> # message auto-generated for no-merge-commit merge: !143 merge master into master docs: add English translation for all markdown documentation files Created-by: sophia1213 Commit-by: sophia1213 Merged-by: cann-robot Description: ## 描述 更新英文非产品文档资料 ## 如何测试 根据最新的中文md资料进行测试 ## 文档更新 非docs目录下的所有xx_en.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!143 | 22 天前 |
| fix:修复 Qwen3.5-MoE/Qwen3.6-MoE 通过deploy导出权重时存在的weight_map异常情况 Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> # message auto-generated for no-merge-commit merge: !165 merge master into master fix:修复 Qwen3.5-MoE/Qwen3.6-MoE 通过deploy导出权重时存在的weight_map异常情况 Created-by: SwaggyAlex Commit-by: SwaggyAlex Merged-by: cann-robot Description: ## 描述 通过iter_deploy_bindings函数对weight_map中的key进行重构 同时在Qwen3.6-MoE的一站式样例中增加deploy的步骤 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!165 | 4 天前 |
| chore: 清理 cmake/function 下未使用的构建文件 Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !158 merge chore/remove-unused-cmake-function into master chore: 清理 cmake/function 下未使用的构建文件 Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述 接入 CANN 公共 cmake 仓后,本地 cmake/function/ 目录下的文件已不再被任何 CMakeLists.txt 或构建脚本引用,属于历史遗留死文件,本次予以清理: - function.cmake:定义的 protobuf_generate / install_package 在全仓无任何调用 - protobuf_sym_rename.cmake:PROTOBUF_SYM_RENAME 变量在全仓无任何引用 - protobuf_3.14_change_version.patch:无任何 patch 应用逻辑引用此文件 当前构建已统一通过 cmake/fetch_cann_cmake.cmake 接入 cann-cmake/function/prepare.cmake,不再依赖这些本地副本。 ## 如何测试 - 全仓检索确认 function.cmake / protobuf_sym_rename / protobuf_3.14_change_version / PROTOBUF_SYM_RENAME / protobuf_generate / install_package 均无源码引用 - bash build.sh --pkg 可正常生成 amct 包 ## 文档更新 无 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!158 | 14 天前 |
| fix: 接通文档承诺的公开导入路径,保证文档示例可直接运行 Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !162 merge fix/doc-auto-calibration-import into master fix: 接通文档承诺的公开导入路径,保证文档示例可直接运行 Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述 文档(README + 各 API 页)给出的多条公开导入路径在代码中并未接通:真实实现深埋在 amct_pytorch/classic/graph_based/amct_pytorch/... 下,而文档给的是简短公开路径,用户照文档 import 即报 ModuleNotFoundError。 以**文档用法为准**补建公开转发模块(均指向健康实现,不改动任何在用逻辑)。每条修复对应的文档出处如下: ### 1. amct_pytorch.common.auto_calibration(AutoCalibrationEvaluatorBase 等 6 个基类) 新建 amct_pytorch/common/auto_calibration/,接通以下文档用法: - docs/README.md:114 —— from amct_pytorch.common.auto_calibration import AutoCalibrationEvaluatorBase - docs/zh/api/accuracy_based_auto_calibration.md:140 —— 同上(自定义 evaluator 继承基类做基于精度的自动量化) ### 2. amct_pytorch.nn.module.quantization.*(5 个 QAT 类) 新建 amct_pytorch/nn/module/quantization/ 三层包 + 5 个转发子模块,接通: - docs/README.md:641-642, 695 —— Conv2dQAT / LinearQAT - docs/zh/api/Conv2dQAT.md:23,29,223,235 —— Conv2dQAT - docs/zh/api/Conv3dQAT.md:25,31,227 —— Conv3dQAT - docs/zh/api/ConvTranspose2dQAT.md —— ConvTranspose2dQAT - docs/zh/api/LinearQAT.md —— LinearQAT - docs/zh/api/QuantCalibrationOp.md —— QuantCalibrationOp ### 3. amct_pytorch.tensor_decompose(auto_decomposition / decompose_network) 新建 amct_pytorch/tensor_decompose/,接通: - docs/README.md:1912,1924,1937 —— auto_decomposition / decompose_network - docs/zh/api/auto_decomposition.md:71 —— from amct_pytorch.tensor_decompose import auto_decomposition - docs/zh/api/decompose_network.md:68 —— from amct_pytorch.tensor_decompose import decompose_network ### 4. amct_pytorch.common.auto_channel_prune(SensitivityBase / SearchChannelBase) 新建 amct_pytorch/common/auto_channel_prune/ 指向健康实现,并修正 README 笔误: - docs/README.md:1023 —— amct.common.auto_channel_prune.sensitivity_base → amct_pytorch.common.auto_channel_prune.sensitivity_base(包名 amct→amct_pytorch) - docs/README.md:1040 —— amct.common.auto_prune.search_channel_base → amct_pytorch.common.auto_channel_prune.search_channel_base(包名修正 + 目录名 auto_prune→auto_channel_prune) - docs/README.md:1037 —— prose 中默认实现路径 auto_prune → auto_channel_prune 同步修正 ## 如何测试 隔离环境(torch 2.7.1 + NPU)实测: - 文档全部 10 条 amct_pytorch 导入语句逐条按原文执行通过 - 顶层 25 个 amct.* API 仍全部可达(新增包未破坏现有导入) - setuptools.find_packages() 可发现 6 个新建转发包,打包进 wheel 不会遗漏 ## 文档更新 修正 docs/README.md:amct→amct_pytorch、auto_prune→auto_channel_prune(共 3 处,含 1 处 prose 路径)。其余 API 页(accuracy_based_auto_calibration / Conv2dQAT / Conv3dQAT / ConvTranspose2dQAT / LinearQAT / QuantCalibrationOp / auto_decomposition / decompose_network)一字未改,靠新增转发模块接通。 ## 类型标签 - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!162 | 10 天前 |
| fix:修复 Qwen3.5-MoE/Qwen3.6-MoE 通过deploy导出权重时存在的weight_map异常情况 Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> # message auto-generated for no-merge-commit merge: !165 merge master into master fix:修复 Qwen3.5-MoE/Qwen3.6-MoE 通过deploy导出权重时存在的weight_map异常情况 Created-by: SwaggyAlex Commit-by: SwaggyAlex Merged-by: cann-robot Description: ## 描述 通过iter_deploy_bindings函数对weight_map中的key进行重构 同时在Qwen3.6-MoE的一站式样例中增加deploy的步骤 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!165 | 4 天前 |
| feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架(.agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 2 天前 |
| fix:修复 Qwen3.5-MoE/Qwen3.6-MoE 通过deploy导出权重时存在的weight_map异常情况 Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> # message auto-generated for no-merge-commit merge: !165 merge master into master fix:修复 Qwen3.5-MoE/Qwen3.6-MoE 通过deploy导出权重时存在的weight_map异常情况 Created-by: SwaggyAlex Commit-by: SwaggyAlex Merged-by: cann-robot Description: ## 描述 通过iter_deploy_bindings函数对weight_map中的key进行重构 同时在Qwen3.6-MoE的一站式样例中增加deploy的步骤 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!165 | 4 天前 |
| 新增文件 .clang-format,保证格式规范统一 Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !61 merge amct_open-patch-2 into master 新增文件 .clang-format,保证格式规范统一 Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述 新增文件 .clang-format,保证C++代码格式规范统一 ## 如何测试 自动规范提交代码格式 ## 文档更新 NA ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!61 | 2 个月前 |
| feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架(.agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 2 天前 |
| 新增pre-commit配置 Co-authored-by: annqr<qiuqianru@h-partners.com> # message auto-generated for no-merge-commit merge: !71 merge master-b into master 新增pre-commit配置 Created-by: annqr Commit-by: annqr Merged-by: cann-robot Description: ## 描述 新增pre-commit配置 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> ## 文档更新 CONTRIBUTING.md文件更新了pre-commit相关说明。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [x] 其他,请描述:配置变更 See merge request: cann/amct!71 | 1 个月前 |
| feat: 新增 --experimental 构建选项以打包实验特性代码 Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !167 merge worktree-feat+experimental-pkg-option into master feat: 新增 --experimental 构建选项以打包实验特性代码 Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述 默认的 --pkg / --torch 构建排除 amct_pytorch/experimental/ 目录,新增 --experimental 标志,使用时将实验特性纳入分发包。 用法示例: bash bash build.sh --torch --experimental bash build.sh --pkg --experimental ## 如何测试 - bash build.sh --help 确认 --experimental 选项出现在帮助输出中 - bash build.sh --torch 产物中不含 amct_pytorch/experimental - bash build.sh --torch --experimental 产物中包含 amct_pytorch/experimental - ruff check / bash -n 语法检查通过,CodeArts Check 0 defects ## 文档更新 - AGENTS.md:补充 --experimental 构建示例 - examples/README.md / README_en.md:FlatQuant 标注实验特性,说明需要 --experimental 构建 - examples/algorithms/flatquant/README_CN.md / README_en.md:顶部加实验特性前置说明 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!167 | 9 天前 |
| build: use cann third party protobuf Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !124 merge fix/use-add-cann-third-party into master build: use cann third party protobuf Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: 关联 Issue:#121 ## 描述 将本仓 protobuf 三方依赖迁移到 cann-cmake 统一入口: - 使用 add_cann_third_party(protobuf) 替换本地 cmake/third_party/protobuf.cmake。 - 开启 ENABLE_OPEN_SRC,确保统一 protobuf 脚本创建 host_protoc、ascend_protobuf_static 等目标。 - 将 proto 编译路径从旧的 build/protobuf_host/bin/protoc 切换为 $<TARGET_FILE:host_protoc>。 - 删除迁移后不再需要的本地 protobuf 脚本和 patch 文件。 ## 如何测试 - git diff --check - cmake -S . -B build_add_cann_third_party_default_check -DENABLE_TEST=OFF - cmake -S . -B build_add_cann_third_party_test_check -DENABLE_TEST=ON 说明:ENABLE_TEST=ON 配置过程中当前环境会打印已有的 torch_npu 后端符号错误 traceback,但 CMake 退出码为 0 并完成配置生成。 ## 文档更新 不涉及文档更新。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [x] 其他,请描述:构建依赖迁移 See merge request: cann/amct!124 | 27 天前 |
| update CONRIBUTING.md for coding-standards Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !21 merge docs into master update CONRIBUTING.md for coding-standards Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述 更新CONRIBUTING.md中关于特性代码风格及代码规范的说明链接 ## 如何测试 走读CONRIBUTING.md文档,描述无误 ## 文档更新 更新了CONRIBUTING.md文档 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!21 | 4 个月前 |
| docs: add English translation for all markdown documentation files Co-authored-by: sophia1213<sophie.chen@huawei.com> # message auto-generated for no-merge-commit merge: !143 merge master into master docs: add English translation for all markdown documentation files Created-by: sophia1213 Commit-by: sophia1213 Merged-by: cann-robot Description: ## 描述 更新英文非产品文档资料 ## 如何测试 根据最新的中文md资料进行测试 ## 文档更新 非docs目录下的所有xx_en.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!143 | 22 天前 |
| Initial commit | 6 个月前 |
| docs: add English translation for all markdown documentation files Co-authored-by: sophia1213<sophie.chen@huawei.com> # message auto-generated for no-merge-commit merge: !143 merge master into master docs: add English translation for all markdown documentation files Created-by: sophia1213 Commit-by: sophia1213 Merged-by: cann-robot Description: ## 描述 更新英文非产品文档资料 ## 如何测试 根据最新的中文md资料进行测试 ## 文档更新 非docs目录下的所有xx_en.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!143 | 22 天前 |
| Initial commit | 6 个月前 |
| 【PR】增加oat_check license检查脚本,用于检测OAT是否正确 Co-authored-by: zhangfands<18768316492@163.com> # message auto-generated for no-merge-commit merge: !126 merge master into master 【PR】增加oat_check license检查脚本,用于检测OAT是否正确 Created-by: zhangfands Commit-by: zhangfands Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 1、oat的precommit从使用java的工具改为使用python,依赖python3.7以上版本,解决了用户需要额外下载安装jdk或者提升python版本的问题。 2、oat.xml文件支持放在/scripts/下,解决用户提出的根目录下配置文件过多的文件。同时向前兼容根目录下放配置文件的方式。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 无 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 无 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [x] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!126 | 23 天前 |
| 调整docs目录区分中英文 Co-authored-by: sophia1213<sophie.chen@huawei.com> # message auto-generated for no-merge-commit merge: !142 merge master into master 调整docs目录区分中英文 Created-by: sophia1213 Commit-by: sophia1213 Merged-by: cann-robot Description: ## 描述 docs目录区分中英文 ## 如何测试 根据最新的目录进行测试 ## 文档更新 docs目录下中的中文文档,移入docs/zh目录,后续英文在docs/en目录 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x ] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!142 | 23 天前 |
| docs: add English translation for all markdown documentation files Co-authored-by: sophia1213<sophie.chen@huawei.com> # message auto-generated for no-merge-commit merge: !143 merge master into master docs: add English translation for all markdown documentation files Created-by: sophia1213 Commit-by: sophia1213 Merged-by: cann-robot Description: ## 描述 更新英文非产品文档资料 ## 如何测试 根据最新的中文md资料进行测试 ## 文档更新 非docs目录下的所有xx_en.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!143 | 22 天前 |
| 调整docs目录区分中英文 Co-authored-by: sophia1213<sophie.chen@huawei.com> # message auto-generated for no-merge-commit merge: !142 merge master into master 调整docs目录区分中英文 Created-by: sophia1213 Commit-by: sophia1213 Merged-by: cann-robot Description: ## 描述 docs目录区分中英文 ## 如何测试 根据最新的目录进行测试 ## 文档更新 docs目录下中的中文文档,移入docs/zh目录,后续英文在docs/en目录 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x ] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!142 | 23 天前 |
| docs: add English translation for all markdown documentation files Co-authored-by: sophia1213<sophie.chen@huawei.com> # message auto-generated for no-merge-commit merge: !143 merge master into master docs: add English translation for all markdown documentation files Created-by: sophia1213 Commit-by: sophia1213 Merged-by: cann-robot Description: ## 描述 更新英文非产品文档资料 ## 如何测试 根据最新的中文md资料进行测试 ## 文档更新 非docs目录下的所有xx_en.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!143 | 22 天前 |
| 接入cann公共cmake仓 Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !78 merge public into master 接入cann公共cmake仓 Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述 删除实际未使用到的cmakefile 接入cann公共cmake仓 ## 如何测试 bash build.sh --pkg生成amct包 ## 文档更新 更新了SECURITY.md文件 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!78 | 2 个月前 |
| [feat] add DeepSeek-V3.2-Exp W8A8C8/W4A8C8 quantization support Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> # message auto-generated for no-merge-commit merge: !3 merge master into master [feat] add DeepSeek-V3.2-Exp W8A8C8/W4A8C8 quantization support Created-by: SwaggyAlex Commit-by: SwaggyAlex Merged-by: cann-robot Description: # 描述 新增对DeepSeek-V3.2-Exp W8A8C8/W4A8C8的量化支持,提供逐block的calibration数据dump、模型训练、精度测验、权重转换脚本,以及使用说明文档 # 类型 [ ] Bug修复 [x] 新功能 [ ] 重构(即不是新增,也不是修改bug的代码改动) [x] 构建过程或辅助工具的变动 [x] 文档内容更新 # 使用说明 **使用前请在sh文件内设置对应模型路径、输出路径等变量** # calibration数据dump bash scripts/dump.sh # 模型训练 bash scripts/train.sh # ppl测算 bash scripts/val.sh # 量化权重输出 bash scripts/deploy.sh # CheckList: [x] 我的代码遵循这个项目的代码风格 [x] 我已经自己测试过我的代码 [x] 我已经更新了对应的文档 [x] 我已经在标题中正确使用了类型标签(例如:feat, fix, refactor, docs, test) # 其他信息 See merge request: cann/amct!3 | 5 个月前 |
| feat: build.sh 按配置变更自动决定是否清理缓存 Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !173 merge feat/incremental-build into master feat: build.sh 按配置变更自动决定是否清理缓存 Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述 原来每次构建都无条件删除 build/ 目录,导致无法利用增量编译,每次均为全量构建。 改为读取 CMakeCache.txt 中的关键编译参数(CMAKE_BUILD_TYPE、ENABLE_EXPERIMENTAL、ENABLE_ASAN),仅在这些值发生变化时才清理缓存,其余情况复用已有构建产物。 用户无需感知清理时机,脚本自动判断: - 编译参数未变(包括混用 --torch/--pkg)→ 增量构建 - --build-type、--experimental、--asan 有变化 → 自动全量清理后重建 - 首次构建或 build/ 不存在 → 直接创建,正常构建 ## 如何测试 1. 执行 bash build.sh --torch,记录编译时间 2. 再次执行 bash build.sh --torch,确认复用缓存,编译时间明显缩短 3. 执行 bash build.sh --torch --build-type=Debug,确认输出 Build config changed, cleaning build cache... 并全量重建 4. 混用 bash build.sh --pkg 与 bash build.sh --torch,确认无问题 ## 文档更新 无需更新文档。 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!173 | 3 天前 |
| [feat] add DeepSeek-V3.2-Exp W8A8C8/W4A8C8 quantization support Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> # message auto-generated for no-merge-commit merge: !3 merge master into master [feat] add DeepSeek-V3.2-Exp W8A8C8/W4A8C8 quantization support Created-by: SwaggyAlex Commit-by: SwaggyAlex Merged-by: cann-robot Description: # 描述 新增对DeepSeek-V3.2-Exp W8A8C8/W4A8C8的量化支持,提供逐block的calibration数据dump、模型训练、精度测验、权重转换脚本,以及使用说明文档 # 类型 [ ] Bug修复 [x] 新功能 [ ] 重构(即不是新增,也不是修改bug的代码改动) [x] 构建过程或辅助工具的变动 [x] 文档内容更新 # 使用说明 **使用前请在sh文件内设置对应模型路径、输出路径等变量** # calibration数据dump bash scripts/dump.sh # 模型训练 bash scripts/train.sh # ppl测算 bash scripts/val.sh # 量化权重输出 bash scripts/deploy.sh # CheckList: [x] 我的代码遵循这个项目的代码风格 [x] 我已经自己测试过我的代码 [x] 我已经更新了对应的文档 [x] 我已经在标题中正确使用了类型标签(例如:feat, fix, refactor, docs, test) # 其他信息 See merge request: cann/amct!3 | 5 个月前 |
| chore: update amct graph package url Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !115 merge update_graph into master chore: update amct graph package url Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述 更新 install_graph.sh 中 cann-amct-graph 包下载地址,从 20260131_newest 的 9.0.0 包更新为 20260520_newest 的 9.1.0 包,使打包流程获取最新 graph 兼容包。 ## 如何测试 - 清理构建缓存和生成物:build/、build_out/、amctgraph/、dist/、tmp/、amct_pytorch.egg-info、amct_pytorch/graph_based_compression/lib/、测试日志/覆盖率和 __pycache__ - 执行:bash build.sh --pkg - 解压:build_out/cann-amct_9.0.0_linux-aarch64.tar.gz - 检查生成物目录结构 验证结果:构建退出码为 0,日志包含 Build success!、package amct run success、Build finished。解压后确认 graph 包内容更新为 cann-amct_acl_9.1.0_linux-aarch64.run、amct_onnx-0.24.0-py3-none-linux_aarch64.whl,且新包不再包含 amct_mindspore/。 ## 文档更新 无。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [x] 其他,请描述:更新构建辅助脚本中的外部 graph 包下载地址 See merge request: cann/amct!115 | 1 个月前 |
| [feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块,用于面向大语言模型的后训练量化、精度评估和部署产物导出,主要包括: 1. 新增并整理 LLM 量化工作流能力 - 新增 amct_pytorch/workflows 与 amct_pytorch/cli/llm,覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 algorithms、common、quantization、workflows 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 amct_pytorch/classic/graph_based,保持历史能力可用。 - 修正安装包数据路径,确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - build.sh -u 默认开启覆盖率采集。 - 新增 pyproject.toml,统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口,使用 pytest 执行 tests/unit_test 与 tests/amct_pytorch。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖,如 datasets、accelerate、compressed_tensors、torchao、einops 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例,包括 Qwen3.6-MoE、DeepSeek-V4 Flash,以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 examples/algorithms 目录,提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证: 1. UT 与覆盖率验证 bash build.sh -u 结果: 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> - 更新根目录 README.md,补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口,并修正 amct_ops 文档链接。 - 更新 docs/AMCT_Pytorch_LLM.md,补充 LLM 量化流程说明,包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 docs/algorithm_brief.md,同步当前支持的量化算法说明。 - 更新 docs/context/ptq_config_param.md,修正配置示例引用路径,避免文档中的样例路径不可用。 - 更新 docs/quick_install.md 与 docs/README.md,同步依赖安装、构建验证和特性说明。 - 更新 examples/README.md,重新整理样例入口,明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档,降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!102 | 28 天前 |
| [feat]: add amct llm Co-authored-by: w00852777<wanghui432@huawei.com> Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: SwaggyAlex<zhangyi601@huawei.com> Co-authored-by: li_ting<liting73@hisilicon.com> # message auto-generated for no-merge-commit merge: !102 merge master into master [feat]: add amct llm Created-by: fujun19 Commit-by: SwaggyAlex;fujun19;wuranxx;li_ting;l00968832;lianghengyi;sophia1213;Hengyi Liang;w00852777 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 本 PR 新增LLM量化工具模块,用于面向大语言模型的后训练量化、精度评估和部署产物导出,主要包括: 1. 新增并整理 LLM 量化工作流能力 - 新增 amct_pytorch/workflows 与 amct_pytorch/cli/llm,覆盖 PTQ、PTQ 数据提取、部署导出、评估等流程。 - 新增通用配置解析、数据处理、模型适配、量化应用、优化器等公共模块。 - 补充 Qwen、LongCat、DeepSeek、GLM 等 LLM 模型适配与量化模块。 2. 调整 AMCT PyTorch 包结构 - 引入 algorithms、common、quantization、workflows 等更清晰的模块划分。 - 将 classic 图量化相关实现收敛到 amct_pytorch/classic/graph_based,保持历史能力可用。 - 修正安装包数据路径,确保 classic graph-based 相关 proto、so、配置等资源能正确打包。 3. 完善构建与测试能力 - build.sh -u 默认开启覆盖率采集。 - 新增 pyproject.toml,统一 pytest 与 coverage 配置。 - 调整 CMake UT 入口,使用 pytest 执行 tests/unit_test 与 tests/amct_pytorch。 - 大幅补充算法、配置、LLM 模型适配、量化模块、workflow 等单元测试。 4. 更新依赖、文档和样例 - 补充 LLM 相关运行依赖,如 datasets、accelerate、compressed_tensors、torchao、einops 等。 - 更新 README、算法说明、LLM 文档、快速安装和 PTQ 配置说明。 - 新增/整理一站式平台样例,包括 Qwen3.6-MoE、DeepSeek-V4 Flash,以及 PTQ、部署、评估、数据提取脚本。 - 将算法样例统一整理到 examples/algorithms 目录,提升样例可发现性和可维护性。 ## 如何测试 <!--描述测试此改动的步骤和前提条件。--> 已进行以下验证: 1. UT 与覆盖率验证 bash build.sh -u 结果: 1911 passed, 2 skipped, 1 xfailed, 371 warnings Coverage XML written to build/coverage.xml ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> - 更新根目录 README.md,补充 AMCT PyTorch 当前包结构、核心能力、一站式平台快速体验入口,并修正 amct_ops 文档链接。 - 更新 docs/AMCT_Pytorch_LLM.md,补充 LLM 量化流程说明,包括 PTQ 数据提取、PTQ 执行、部署导出和评估流程。 - 更新 docs/algorithm_brief.md,同步当前支持的量化算法说明。 - 更新 docs/context/ptq_config_param.md,修正配置示例引用路径,避免文档中的样例路径不可用。 - 更新 docs/quick_install.md 与 docs/README.md,同步依赖安装、构建验证和特性说明。 - 更新 examples/README.md,重新整理样例入口,明确算法样例与模型端到端样例的使用路径。 - 新增/完善 Qwen3.6-MoE 与 DeepSeek-V4 Flash 一站式平台样例文档,降低用户在 Atlas A3 环境中完成 NPU 推理体验的上手成本。 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!102 | 28 天前 |
| feat: 新增 --experimental 构建选项以打包实验特性代码 Co-authored-by: fujun19<fujun19@hisilicon.com> # message auto-generated for no-merge-commit merge: !167 merge worktree-feat+experimental-pkg-option into master feat: 新增 --experimental 构建选项以打包实验特性代码 Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述 默认的 --pkg / --torch 构建排除 amct_pytorch/experimental/ 目录,新增 --experimental 标志,使用时将实验特性纳入分发包。 用法示例: bash bash build.sh --torch --experimental bash build.sh --pkg --experimental ## 如何测试 - bash build.sh --help 确认 --experimental 选项出现在帮助输出中 - bash build.sh --torch 产物中不含 amct_pytorch/experimental - bash build.sh --torch --experimental 产物中包含 amct_pytorch/experimental - ruff check / bash -n 语法检查通过,CodeArts Check 0 defects ## 文档更新 - AGENTS.md:补充 --experimental 构建示例 - examples/README.md / README_en.md:FlatQuant 标注实验特性,说明需要 --experimental 构建 - examples/algorithms/flatquant/README_CN.md / README_en.md:顶部加实验特性前置说明 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!167 | 9 天前 |
| add amct_pytorch pkg Co-authored-by: fujun19<fujun19@hisilicon.com> Co-authored-by: fujun19<ikX6KxGSevEwXSku7b7TnwyZ> # message auto-generated for no-merge-commit merge: !19 merge amct_pytorch into master add amct_pytorch pkg Created-by: fujun19 Commit-by: fujun19 Merged-by: cann-robot Description: ## 描述 新增amct_pytorch部分功能开源,包含数据与权重低比特量化、张量分解、模型部署优化(主要为算子融合)等功能 https://www.hiascend.com/document/detail/zh/canncommercial/850/devaids/amct/atlasamct_16_0001.html ## 如何测试 bash build.sh --pkg构建出包 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!19 | 4 个月前 |