文件最后提交记录最后更新时间
【课程社区共建】新增大语言模型微调实战课程框架 Co-authored-by: 韩翔宇<admin@pescn.cn> # message auto-generated for no-merge-commit merge: !69 merge master into master 【课程社区共建】新增大语言模型微调实战课程框架 Created-by: pescn Commit-by: 韩翔宇 Merged-by: cann-robot Description: ## 描述 本课程面向**高校在校学生**,结合 SwanLab 团队正在开展的**线下启航营**实践内容,围绕 Qwen3 系列模型在昇腾 NPU 上的训练与加速展开。 本 PR 包括**大语言模型微调实战课程**中第一章:Qwen3 基座模型指令微调(SFT)的内容 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [x] 内容优化 - [ ] 其他,请描述: ## 其他说明 第二章课程数据集部分还在做合规和脱敏,因此临时处于占位符状态 See merge request: cann/cann-learning-hub!6916 天前
【课程社区共建】新增大语言模型微调实战课程框架 Co-authored-by: 韩翔宇<admin@pescn.cn> # message auto-generated for no-merge-commit merge: !69 merge master into master 【课程社区共建】新增大语言模型微调实战课程框架 Created-by: pescn Commit-by: 韩翔宇 Merged-by: cann-robot Description: ## 描述 本课程面向**高校在校学生**,结合 SwanLab 团队正在开展的**线下启航营**实践内容,围绕 Qwen3 系列模型在昇腾 NPU 上的训练与加速展开。 本 PR 包括**大语言模型微调实战课程**中第一章:Qwen3 基座模型指令微调(SFT)的内容 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [x] 内容优化 - [ ] 其他,请描述: ## 其他说明 第二章课程数据集部分还在做合规和脱敏,因此临时处于占位符状态 See merge request: cann/cann-learning-hub!6916 天前
README.md

SwanLab

SwanLab x CANN 社区合作课程


第 02 章 · 大语言模型微调

章节定位

本章围绕 Qwen3 系列模型,按"原理 → 数据 / 模板 → SFT → LoRA → 工程实践"的顺序,完整跑通一次端到端微调流程。 预期读者在学完本章后,能理解 Chat Template、Special Token、Loss Mask、LoRA 低秩适配、超参数选择、效果评估等工程细节,并能在昇腾 NPU 上独立完成一次面向自己业务数据的指令微调,而不只是停留在套用 LLaMA Factory 等工具。

计划节次

节次 标题 状态
02.01 章节介绍 建设中
02.02 微调与 LoRA 原理 建设中
02.03 Chat Template 与 Special Token 建设中
02.04 Qwen3 基座模型指令微调(SFT) 已发布
02.05 Qwen3 LoRA 微调:量化因子代码生成实战 建设中
02.06 用 ms-swift 复现 SFT / LoRA 微调(成熟工具链对照) 建设中
02.07 数据合成 建设中
02.08 微调超参数与科学调参 建设中
02.09 微调效果评估 建设中