| 文件 | 最后提交记录 | 最后更新时间 |
|---|---|---|
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 | |
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 | |
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 | |
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 | |
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 |
Agent Docs
.agents/docs/ 用来保存仓库里相对稳定、适合长期复用的知识,不直接承担执行型约束。
内容组成
repo-map.md- 记录代码结构、关键模块和锚点文件
casebook/- 记录模型适配经验、量化经验和典型问题
roadmap.md- skills 清单与演进规划(已实现 / 规划中)
使用原则
- 这里放稳定知识,不放一次性的实验过程
- 执行型规则、步骤和分流逻辑放在
skills/ - 如果某类经验已经足够稳定,适合长期复用,再从
skills/quant-tools/references/沉淀到这里
文档写回触发
agent 完成一轮工作后据此维护本 docs(执行型流程在 skills/,这里只放稳定知识与维护策略):
repo-map.md:register_llm_models()注册集 / solver 主注册链 / workflow 主路径语义 /BaseModel·PtqUnit·quant_apply·quant_base复用边界变化,或现状已与代码不一致。- 系列
casebook/<vendor>/README.md:某模型首次拿到稳定闭环(BF16 baseline + 关闭量化等价 + 最小 PTQ smoke),或系列默认起点/敏感模块/升级策略/常见问题需补订,或新结果推翻系列默认经验。 - 个案
casebook/<vendor>/<case>.md:新结构模式 / 新量化或 PTQ 路线 / 代表性可复用问题 / 明显偏离系列经验 / 已有个案需按新结论修订;仅本模型独有、不可迁移的坑留这层。 - 经验库
casebook/{cross-model,structure-family}-pitfalls.md:跨网络通用 / 结构家族通用的可复用坑写回;三层晋升护栏见 casebook/README.md 维护规则(单例先 L3、同家族 ≥2 升 L2、跨家族升 L1,防过度泛化)。 README.md(本文件):docs 层级 / 职责边界变化,或目录结构与真实不一致。- 默认不写:单次失败 / 不稳定结果;BF16 baseline 自身不稳;只修局部 wrapper bug 不重写 repo-map;本轮无新增可复用信息(需说明无需更新)。