0

0

cann-robot【课程社区共建】新增大语言模型微调实战课程框架

7bfec91f创建于 16 天前历史提交

文件	最后提交记录	最后更新时间
02.04_qwen3_instruction_sft.ipynb	【课程社区共建】新增大语言模型微调实战课程框架 Co-authored-by: 韩翔宇<admin@pescn.cn> # message auto-generated for no-merge-commit merge: !69 merge master into master 【课程社区共建】新增大语言模型微调实战课程框架 Created-by: pescn Commit-by: 韩翔宇 Merged-by: cann-robot Description: ## 描述本课程面向高校在校学生，结合 SwanLab 团队正在开展的线下启航营实践内容，围绕 Qwen3 系列模型在昇腾 NPU 上的训练与加速展开。本 PR 包括大语言模型微调实战课程中第一章：Qwen3 基座模型指令微调（SFT）的内容 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [x] 内容优化 - [ ] 其他，请描述： ## 其他说明第二章课程数据集部分还在做合规和脱敏，因此临时处于占位符状态 See merge request: cann/cann-learning-hub!69	16 天前
README.md	【课程社区共建】新增大语言模型微调实战课程框架 Co-authored-by: 韩翔宇<admin@pescn.cn> # message auto-generated for no-merge-commit merge: !69 merge master into master 【课程社区共建】新增大语言模型微调实战课程框架 Created-by: pescn Commit-by: 韩翔宇 Merged-by: cann-robot Description: ## 描述本课程面向高校在校学生，结合 SwanLab 团队正在开展的线下启航营实践内容，围绕 Qwen3 系列模型在昇腾 NPU 上的训练与加速展开。本 PR 包括大语言模型微调实战课程中第一章：Qwen3 基座模型指令微调（SFT）的内容 ## 类型标签 - [ ] Bug修复 - [ ] 新特性 - [x] 内容优化 - [ ] 其他，请描述： ## 其他说明第二章课程数据集部分还在做合规和脱敏，因此临时处于占位符状态 See merge request: cann/cann-learning-hub!69	16 天前

SwanLab

SwanLab x CANN 社区合作课程

第 02 章 · 大语言模型微调

章节定位

本章围绕 Qwen3 系列模型，按"原理 → 数据 / 模板 → SFT → LoRA → 工程实践"的顺序，完整跑通一次端到端微调流程。预期读者在学完本章后，能理解 Chat Template、Special Token、Loss Mask、LoRA 低秩适配、超参数选择、效果评估等工程细节，并能在昇腾 NPU 上独立完成一次面向自己业务数据的指令微调，而不只是停留在套用 LLaMA Factory 等工具。

计划节次

节次	标题	状态
02.01	章节介绍	建设中
02.02	微调与 LoRA 原理	建设中
02.03	Chat Template 与 Special Token	建设中
02.04	Qwen3 基座模型指令微调（SFT）	已发布
02.05	Qwen3 LoRA 微调：量化因子代码生成实战	建设中
02.06	用 ms-swift 复现 SFT / LoRA 微调（成熟工具链对照）	建设中
02.07	数据合成	建设中
02.08	微调超参数与科学调参	建设中
02.09	微调效果评估	建设中