SwanLab

SwanLab x CANN 社区合作课程


第 02 章 · 大语言模型微调

章节定位

本章围绕 Qwen3 系列模型,按"原理 → 数据 / 模板 → SFT → LoRA → 工程实践"的顺序,完整跑通一次端到端微调流程。 预期读者在学完本章后,能理解 Chat Template、Special Token、Loss Mask、LoRA 低秩适配、超参数选择、效果评估等工程细节,并能在昇腾 NPU 上独立完成一次面向自己业务数据的指令微调,而不只是停留在套用 LLaMA Factory 等工具。

计划节次

节次 标题 状态
02.01 章节介绍 建设中
02.02 微调与 LoRA 原理 建设中
02.03 Chat Template 与 Special Token 建设中
02.04 Qwen3 基座模型指令微调(SFT) 已发布
02.05 Qwen3 LoRA 微调:量化因子代码生成实战 建设中
02.06 用 ms-swift 复现 SFT / LoRA 微调(成熟工具链对照) 建设中
02.07 数据合成 建设中
02.08 微调超参数与科学调参 建设中
02.09 微调效果评估 建设中