
SwanLab x CANN 社区合作课程
第 01 章 · 大语言模型基础理论介绍
章节定位
本章面向完全没有大模型背景的同学,建立后续 02-05 章所需的基础知识与术语体系。 预期读者在学完本章后,能看懂后续章节里出现的 token、Transformer、self-attention、KV cache、SFT、LoRA、RLHF 等术语,知道它们大致在解决什么问题。
计划节次
| 节次 | 标题(暂定) | 状态 |
|---|---|---|
| 01.01 | 章节简介与学习路径 | 建设中 |
| 01.02 | 从词向量到 Transformer | 建设中 |
| 01.03 | 自注意力机制与位置编码 | 建设中 |
| 01.04 | 预训练、SFT、RLHF 三段式流程 | 建设中 |
| 01.05 | 推理过程与 KV cache | 建设中 |