0ecfdf4c创建于 3 天前历史提交

文件	最后提交记录	最后更新时间
casebook	feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架（`.agents/`），把 amct（`amct_pytorch`）的 LLM 量化全流程（`eval / extract_ptq_data / ptq / deploy` + blockwise PTQ）封装为可用自然语言驱动的 agent 能力，同时适配 Claude Code 与 OpenCode。 1. 单源双视图：`.agents/` 为唯一 git-tracked 源；`scripts/init-agent.sh` 投影生成 `.claude/` 与 `.opencode/` 客户端视图（gitignored）。原 `.claude/` 下 skills 迁为 `.agents/` 源；`CLAUDE.md` 改由脚本生成的仓根 symlink → `AGENTS.md`。 2. 单编排入口 `quant-workflow` + 3 专职子代理（`quant-analyzer` 分析 / `quant-implementer` 实施 / `quant-reviewer` 审查，硬边界隔离）+ 叶子技能（`quant-tools/`：方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出；`model-adapter`）+ 通用协作（`gitcode-pr` / `gitcode-issue` / `default-skills`）+ 共享输入模板。 3. casebook 三层经验库：L1 跨网络 `common-pitfalls.md` / L2 结构家族 `family-pitfalls.md`（含触发信号）/ L3 各厂商系列个案（qwen ×5、deepseek v3.2·v4、glm-5.1、longcat），按源码 `common/models/llm/<vendor>/` 对齐；只沉淀可复用 hard bug + 适配重点 + 精度。 4. 多 agent 集成契约：`quant-workflow` 为唯一入口（黑盒），`progress.md` 顶部机读状态块（`STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED`）供轮询；前置不满足 fail-fast 写 `BLOCKED`；human-in-the-loop 四确认门；`architecture.md §8` 给出集成契约，README 含前置声明与自然语言示例。 ## 如何测试 1. 量化 agent 功能：`bash scripts/init-agent.sh` 后用 opencode 启动 agent，给「为 Qwen3-8B 推荐量化方案（只分析不跑 NPU）」→ 正确路由到 scheme-recommendation，复用 casebook（Qwen3-4B/8B 实测值）给出 W8A8 直转首推 + 升级/回退路径，未触发评测命令。 2. 脚手架：`init-agent.sh` 生成 `.claude/{skills,agents,hooks,settings.json}` + `.opencode/{skills,agents}` + `CLAUDE.md`；生成的 `settings.json` 无 SessionStart hook、无 `install-default-skills.ts`（自动安装已移除、按需保留）。 3. 量化主流程冒烟：按 `direct-quant-eval` / `deploy-export` 技能跑一遍 eval/deploy，产物正常。 ## 文档更新 - 新增 `.agents/**`、`scripts/init-agent.sh`。 - 更新 `.gitignore`。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!148	3 天前
README.md	feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架（`.agents/`），把 amct（`amct_pytorch`）的 LLM 量化全流程（`eval / extract_ptq_data / ptq / deploy` + blockwise PTQ）封装为可用自然语言驱动的 agent 能力，同时适配 Claude Code 与 OpenCode。 1. 单源双视图：`.agents/` 为唯一 git-tracked 源；`scripts/init-agent.sh` 投影生成 `.claude/` 与 `.opencode/` 客户端视图（gitignored）。原 `.claude/` 下 skills 迁为 `.agents/` 源；`CLAUDE.md` 改由脚本生成的仓根 symlink → `AGENTS.md`。 2. 单编排入口 `quant-workflow` + 3 专职子代理（`quant-analyzer` 分析 / `quant-implementer` 实施 / `quant-reviewer` 审查，硬边界隔离）+ 叶子技能（`quant-tools/`：方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出；`model-adapter`）+ 通用协作（`gitcode-pr` / `gitcode-issue` / `default-skills`）+ 共享输入模板。 3. casebook 三层经验库：L1 跨网络 `common-pitfalls.md` / L2 结构家族 `family-pitfalls.md`（含触发信号）/ L3 各厂商系列个案（qwen ×5、deepseek v3.2·v4、glm-5.1、longcat），按源码 `common/models/llm/<vendor>/` 对齐；只沉淀可复用 hard bug + 适配重点 + 精度。 4. 多 agent 集成契约：`quant-workflow` 为唯一入口（黑盒），`progress.md` 顶部机读状态块（`STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED`）供轮询；前置不满足 fail-fast 写 `BLOCKED`；human-in-the-loop 四确认门；`architecture.md §8` 给出集成契约，README 含前置声明与自然语言示例。 ## 如何测试 1. 量化 agent 功能：`bash scripts/init-agent.sh` 后用 opencode 启动 agent，给「为 Qwen3-8B 推荐量化方案（只分析不跑 NPU）」→ 正确路由到 scheme-recommendation，复用 casebook（Qwen3-4B/8B 实测值）给出 W8A8 直转首推 + 升级/回退路径，未触发评测命令。 2. 脚手架：`init-agent.sh` 生成 `.claude/{skills,agents,hooks,settings.json}` + `.opencode/{skills,agents}` + `CLAUDE.md`；生成的 `settings.json` 无 SessionStart hook、无 `install-default-skills.ts`（自动安装已移除、按需保留）。 3. 量化主流程冒烟：按 `direct-quant-eval` / `deploy-export` 技能跑一遍 eval/deploy，产物正常。 ## 文档更新 - 新增 `.agents/**`、`scripts/init-agent.sh`。 - 更新 `.gitignore`。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!148	3 天前
architecture.md	feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架（`.agents/`），把 amct（`amct_pytorch`）的 LLM 量化全流程（`eval / extract_ptq_data / ptq / deploy` + blockwise PTQ）封装为可用自然语言驱动的 agent 能力，同时适配 Claude Code 与 OpenCode。 1. 单源双视图：`.agents/` 为唯一 git-tracked 源；`scripts/init-agent.sh` 投影生成 `.claude/` 与 `.opencode/` 客户端视图（gitignored）。原 `.claude/` 下 skills 迁为 `.agents/` 源；`CLAUDE.md` 改由脚本生成的仓根 symlink → `AGENTS.md`。 2. 单编排入口 `quant-workflow` + 3 专职子代理（`quant-analyzer` 分析 / `quant-implementer` 实施 / `quant-reviewer` 审查，硬边界隔离）+ 叶子技能（`quant-tools/`：方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出；`model-adapter`）+ 通用协作（`gitcode-pr` / `gitcode-issue` / `default-skills`）+ 共享输入模板。 3. casebook 三层经验库：L1 跨网络 `common-pitfalls.md` / L2 结构家族 `family-pitfalls.md`（含触发信号）/ L3 各厂商系列个案（qwen ×5、deepseek v3.2·v4、glm-5.1、longcat），按源码 `common/models/llm/<vendor>/` 对齐；只沉淀可复用 hard bug + 适配重点 + 精度。 4. 多 agent 集成契约：`quant-workflow` 为唯一入口（黑盒），`progress.md` 顶部机读状态块（`STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED`）供轮询；前置不满足 fail-fast 写 `BLOCKED`；human-in-the-loop 四确认门；`architecture.md §8` 给出集成契约，README 含前置声明与自然语言示例。 ## 如何测试 1. 量化 agent 功能：`bash scripts/init-agent.sh` 后用 opencode 启动 agent，给「为 Qwen3-8B 推荐量化方案（只分析不跑 NPU）」→ 正确路由到 scheme-recommendation，复用 casebook（Qwen3-4B/8B 实测值）给出 W8A8 直转首推 + 升级/回退路径，未触发评测命令。 2. 脚手架：`init-agent.sh` 生成 `.claude/{skills,agents,hooks,settings.json}` + `.opencode/{skills,agents}` + `CLAUDE.md`；生成的 `settings.json` 无 SessionStart hook、无 `install-default-skills.ts`（自动安装已移除、按需保留）。 3. 量化主流程冒烟：按 `direct-quant-eval` / `deploy-export` 技能跑一遍 eval/deploy，产物正常。 ## 文档更新 - 新增 `.agents/**`、`scripts/init-agent.sh`。 - 更新 `.gitignore`。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!148	3 天前
repo-map.md	feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架（`.agents/`），把 amct（`amct_pytorch`）的 LLM 量化全流程（`eval / extract_ptq_data / ptq / deploy` + blockwise PTQ）封装为可用自然语言驱动的 agent 能力，同时适配 Claude Code 与 OpenCode。 1. 单源双视图：`.agents/` 为唯一 git-tracked 源；`scripts/init-agent.sh` 投影生成 `.claude/` 与 `.opencode/` 客户端视图（gitignored）。原 `.claude/` 下 skills 迁为 `.agents/` 源；`CLAUDE.md` 改由脚本生成的仓根 symlink → `AGENTS.md`。 2. 单编排入口 `quant-workflow` + 3 专职子代理（`quant-analyzer` 分析 / `quant-implementer` 实施 / `quant-reviewer` 审查，硬边界隔离）+ 叶子技能（`quant-tools/`：方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出；`model-adapter`）+ 通用协作（`gitcode-pr` / `gitcode-issue` / `default-skills`）+ 共享输入模板。 3. casebook 三层经验库：L1 跨网络 `common-pitfalls.md` / L2 结构家族 `family-pitfalls.md`（含触发信号）/ L3 各厂商系列个案（qwen ×5、deepseek v3.2·v4、glm-5.1、longcat），按源码 `common/models/llm/<vendor>/` 对齐；只沉淀可复用 hard bug + 适配重点 + 精度。 4. 多 agent 集成契约：`quant-workflow` 为唯一入口（黑盒），`progress.md` 顶部机读状态块（`STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED`）供轮询；前置不满足 fail-fast 写 `BLOCKED`；human-in-the-loop 四确认门；`architecture.md §8` 给出集成契约，README 含前置声明与自然语言示例。 ## 如何测试 1. 量化 agent 功能：`bash scripts/init-agent.sh` 后用 opencode 启动 agent，给「为 Qwen3-8B 推荐量化方案（只分析不跑 NPU）」→ 正确路由到 scheme-recommendation，复用 casebook（Qwen3-4B/8B 实测值）给出 W8A8 直转首推 + 升级/回退路径，未触发评测命令。 2. 脚手架：`init-agent.sh` 生成 `.claude/{skills,agents,hooks,settings.json}` + `.opencode/{skills,agents}` + `CLAUDE.md`；生成的 `settings.json` 无 SessionStart hook、无 `install-default-skills.ts`（自动安装已移除、按需保留）。 3. 量化主流程冒烟：按 `direct-quant-eval` / `deploy-export` 技能跑一遍 eval/deploy，产物正常。 ## 文档更新 - 新增 `.agents/**`、`scripts/init-agent.sh`。 - 更新 `.gitignore`。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!148	3 天前
roadmap.md	feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架（`.agents/`），把 amct（`amct_pytorch`）的 LLM 量化全流程（`eval / extract_ptq_data / ptq / deploy` + blockwise PTQ）封装为可用自然语言驱动的 agent 能力，同时适配 Claude Code 与 OpenCode。 1. 单源双视图：`.agents/` 为唯一 git-tracked 源；`scripts/init-agent.sh` 投影生成 `.claude/` 与 `.opencode/` 客户端视图（gitignored）。原 `.claude/` 下 skills 迁为 `.agents/` 源；`CLAUDE.md` 改由脚本生成的仓根 symlink → `AGENTS.md`。 2. 单编排入口 `quant-workflow` + 3 专职子代理（`quant-analyzer` 分析 / `quant-implementer` 实施 / `quant-reviewer` 审查，硬边界隔离）+ 叶子技能（`quant-tools/`：方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出；`model-adapter`）+ 通用协作（`gitcode-pr` / `gitcode-issue` / `default-skills`）+ 共享输入模板。 3. casebook 三层经验库：L1 跨网络 `common-pitfalls.md` / L2 结构家族 `family-pitfalls.md`（含触发信号）/ L3 各厂商系列个案（qwen ×5、deepseek v3.2·v4、glm-5.1、longcat），按源码 `common/models/llm/<vendor>/` 对齐；只沉淀可复用 hard bug + 适配重点 + 精度。 4. 多 agent 集成契约：`quant-workflow` 为唯一入口（黑盒），`progress.md` 顶部机读状态块（`STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED`）供轮询；前置不满足 fail-fast 写 `BLOCKED`；human-in-the-loop 四确认门；`architecture.md §8` 给出集成契约，README 含前置声明与自然语言示例。 ## 如何测试 1. 量化 agent 功能：`bash scripts/init-agent.sh` 后用 opencode 启动 agent，给「为 Qwen3-8B 推荐量化方案（只分析不跑 NPU）」→ 正确路由到 scheme-recommendation，复用 casebook（Qwen3-4B/8B 实测值）给出 W8A8 直转首推 + 升级/回退路径，未触发评测命令。 2. 脚手架：`init-agent.sh` 生成 `.claude/{skills,agents,hooks,settings.json}` + `.opencode/{skills,agents}` + `CLAUDE.md`；生成的 `settings.json` 无 SessionStart hook、无 `install-default-skills.ts`（自动安装已移除、按需保留）。 3. 量化主流程冒烟：按 `direct-quant-eval` / `deploy-export` 技能跑一遍 eval/deploy，产物正常。 ## 文档更新 - 新增 `.agents/**`、`scripts/init-agent.sh`。 - 更新 `.gitignore`。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他，请描述： See merge request: cann/amct!148	3 天前

Agent Docs

.agents/docs/ 用来保存仓库里相对稳定、适合长期复用的知识，不直接承担执行型约束。

内容组成

repo-map.md
- 记录代码结构、关键模块和锚点文件
casebook/
- 记录模型适配经验、量化经验和典型问题
roadmap.md
- skills 清单与演进规划（已实现 / 规划中）

使用原则

这里放稳定知识，不放一次性的实验过程
执行型规则、步骤和分流逻辑放在 skills/
如果某类经验已经足够稳定，适合长期复用，再从 skills/quant-tools/references/ 沉淀到这里

文档写回触发

agent 完成一轮工作后据此维护本 docs（执行型流程在 skills/，这里只放稳定知识与维护策略）：

repo-map.md：register_llm_models() 注册集 / solver 主注册链 / workflow 主路径语义 / BaseModel·PtqUnit·quant_apply·quant_base 复用边界变化，或现状已与代码不一致。
系列 casebook/<vendor>/README.md：某模型首次拿到稳定闭环（BF16 baseline + 关闭量化等价 + 最小 PTQ smoke），或系列默认起点/敏感模块/升级策略/常见问题需补订，或新结果推翻系列默认经验。
个案 casebook/<vendor>/<case>.md：新结构模式 / 新量化或 PTQ 路线 / 代表性可复用问题 / 明显偏离系列经验 / 已有个案需按新结论修订；仅本模型独有、不可迁移的坑留这层。
经验库 casebook/{cross-model,structure-family}-pitfalls.md：跨网络通用 / 结构家族通用的可复用坑写回；三层晋升护栏见 casebook/README.md 维护规则（单例先 L3、同家族 ≥2 升 L2、跨家族升 L1，防过度泛化）。
README.md（本文件）：docs 层级 / 职责边界变化，或目录结构与真实不一致。
默认不写：单次失败 / 不稳定结果；BF16 baseline 自身不稳；只修局部 wrapper bug 不重写 repo-map；本轮无新增可复用信息（需说明无需更新）。