| 文件 | 最后提交记录 | 最后更新时间 |
|---|---|---|
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 | |
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 | |
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 | |
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 | |
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 | |
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 | |
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 | |
feat: 量化agent引入 Co-authored-by: xieyajun<xieyajun1@huawei.com> # message auto-generated for no-merge-commit merge: !148 merge feat/quant-agent-migration into master feat: 量化agent引入 Created-by: xieyajun Commit-by: xieyajun Merged-by: cann-robot Description: ## 描述 引入「昇腾 NPU 大模型量化压缩」的 Agent Skills 框架( .agents/),把 amct(amct_pytorch)的 LLM 量化全流程(eval / extract_ptq_data / ptq / deploy + blockwise PTQ)封装为可用自然语言驱动的 agent 能力,同时适配 Claude Code 与 OpenCode。 1. **单源双视图**:.agents/ 为唯一 git-tracked 源;scripts/init-agent.sh 投影生成 .claude/ 与 .opencode/ 客户端视图(gitignored)。原 .claude/ 下 skills 迁为 .agents/ 源;CLAUDE.md 改由脚本生成的仓根 symlink → AGENTS.md。 2. **单编排入口 quant-workflow** + 3 专职子代理(quant-analyzer 分析 / quant-implementer 实施 / quant-reviewer 审查,硬边界隔离)+ 叶子技能(quant-tools/:方案推荐 / 直转评测 / 算法推荐 / 算法验证 / 部署导出;model-adapter)+ 通用协作(gitcode-pr / gitcode-issue / default-skills)+ 共享输入模板。 3. **casebook 三层经验库**:L1 跨网络 common-pitfalls.md / L2 结构家族 family-pitfalls.md(含触发信号)/ L3 各厂商系列个案(qwen ×5、deepseek v3.2·v4、glm-5.1、longcat),按源码 common/models/llm/<vendor>/ 对齐;只沉淀可复用 hard bug + 适配重点 + 精度。 4. **多 agent 集成契约**:quant-workflow 为唯一入口(黑盒),progress.md 顶部机读状态块(STAGE/STATUS/DELTA/ARTIFACTS/BLOCKED)供轮询;前置不满足 fail-fast 写 BLOCKED;human-in-the-loop 四确认门;architecture.md §8 给出集成契约,README 含前置声明与自然语言示例。 ## 如何测试 1. **量化 agent 功能**:bash scripts/init-agent.sh 后用 opencode 启动 agent,给「为 Qwen3-8B 推荐量化方案(只分析不跑 NPU)」→ 正确路由到 scheme-recommendation,复用 casebook(Qwen3-4B/8B 实测值)给出 W8A8 直转首推 + 升级/回退路径,未触发评测命令。 2. **脚手架**:init-agent.sh 生成 .claude/{skills,agents,hooks,settings.json} + .opencode/{skills,agents} + CLAUDE.md;生成的 settings.json 无 SessionStart hook、无 install-default-skills.ts(自动安装已移除、按需保留)。 3. **量化主流程冒烟**:按 direct-quant-eval / deploy-export 技能跑一遍 eval/deploy,产物正常。 ## 文档更新 - 新增 .agents/**、scripts/init-agent.sh。 - 更新 .gitignore。 ## 类型标签 - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [x] 文档更新 - [x] 代码重构 - [ ] 其他,请描述: See merge request: cann/amct!148 | 3 天前 |
Casebook
casebook/ 沉淀模型适配与量化中可复用、且不易解决的经验:后续其他网络会再遇到的 hard bug、适配重点、关键精度,而不是一次性小问题或 agent 环境/过度推断类问题。
三层抽象(agent 适配新模型的检索主轴)
经验按"普适程度"分三层,agent 适配新模型时自外向内取用:
- L1 跨网络通用
cross-model-pitfalls.md—— 与具体结构无关,任何新模型都先通读。 - L2 结构家族通用
structure-family-pitfalls.md—— 仅对某类结构成立(MoE / 混合 attention / 自定义 modeling / MLA)。按触发信号判断新模型属哪几类(可多属),叠加 L1 读对应小节。 - L3 模型专属 —— 各
<vendor>/<model>.md个案,只放该模型/家族独有、不可迁移的坑。
agent 用法:新模型进来 → 读 L1 → 按 config/checkpoint 信号选中的 L2 家族(取并集)→ 找结构最近的 L3 个案起步。没有专属个案时,L1+L2 仍给强先验。
组织方式
L3 个案按厂商系列组织,与源码 amct_pytorch/common/models/llm/<vendor>/ 对齐。同一源类、或纯子类(零/单方法 delta)的不同尺寸模型合并为一个个案(同结构归一)。
casebook/
cross-model-pitfalls.md # L1
structure-family-pitfalls.md # L2
case-template.md # L3 模板
qwen/ deepseek/ glm/ longcat/ # L3 + 各系列 README
L3 个案导航(按系列)
- qwen/:
qwen3-dense(4B/8B)、qwen3-moe(30B-A3B/235B-A22B)、qwen3.5-3.6(35B-A3B/35B)、qwen3-next-80b-a3b-instruct - deepseek/:
deepseekv4、deepseek-v3.2 - glm/:
glm-5.1(继承 DeepseekV32,瘦案例) - longcat/:
longcat(Flash-Lite/Next)
个案均对应源码
register_llm_models()已注册的 adapter(casebook ⊆ 已适配)。
维护规则
- 只记可复用、难解的结论;一次性小问题、agent 环境/过度推断不入库。
- 分层归档:新坑先判普适程度——普适→L1、某结构家族→L2、仅此模型→L3。
- ≥2 例才晋升:单模型新发现默认先留 L3(标"待复现");同家族 ≥2 模型复现才升 L2,跨家族复现才升 L1。防单例过度泛化(别从 1 个 MoE 断言"所有 MoE")。
- 清单非全集:L1/L2 的自检清单是先验、不是闸门;清单外现象照常据证据诊断 + 归档(必要时新增家族/个案)。
- 开放分类:L2 家族不锁死枚举,出现新结构模式(如 SSM/新稀疏 attention)就新增小节 + 触发信号。
- 合并依据 = 继承 + override 审计(
wc -l/grep defs/读非透传方法),不是继承声明本身:pass子类零 delta 直接合;只 override 个别方法的(如 LongCat-Next 仅empty_weights_model)合并并把那一处写成 delta 段;override 体量大、语义偏移多的不合。