SwanLab

SwanLab x CANN 社区合作课程


第 01 章 · 大语言模型基础理论介绍

章节定位

本章面向完全没有大模型背景的同学,建立后续 02-05 章所需的基础知识与术语体系。 预期读者在学完本章后,能看懂后续章节里出现的 token、Transformer、self-attention、KV cache、SFT、LoRA、RLHF 等术语,知道它们大致在解决什么问题。

计划节次

节次 标题(暂定) 状态
01.01 章节简介与学习路径 建设中
01.02 从词向量到 Transformer 建设中
01.03 自注意力机制与位置编码 建设中
01.04 预训练、SFT、RLHF 三段式流程 建设中
01.05 推理过程与 KV cache 建设中