MindSpeed 版本说明书

MindSpeed 2.1.0

本框架基于NVIDIA主导的开源Megatron进行修改，采用插件化适配方式，延续原生的Megatron特性，使用NPU进行大模型加速训练；代码重用性好，支持现有的网络只修改设备类型或数据类型，即可迁移到NPU上使用。使能客户大模型业务快速迁移至昇腾设备，并且支持昇腾专有算法。

表 1 MindSpeed支持的版本特性列表

一级特性	二级特性	说明
Megatron原生特性	数据并行	支持数据并行训练策略
	张量并行	支持张量并行训练策略
	流水并行	支持流水并行训练策略
	张量并行	支持张量并行训练策略
	虚拟流水线并行	支持虚拟流水线并行训练策略
	序列并行	支持序列并行训练策略
	重计算	支持选择性重计算和完全重计算策略
	分布式优化器	支持分布式优化器策略，将优化器状态拆分到所有DP组间
	异步DDP	支持异步DDP，在进行梯度更新时，将数据并行组中的通信和计算并行执行
昇腾专有算法	TP 重计算通信优化	重计算通信算子消除，优化重计算层划分，实现大模型训练通信性能提升
	自适应选择重计算	支持通过自动调整训练内存大小来自动选择重新计算策略
	计算通信并行优化	通过将计算和通信任务分别拆分成更细粒度的子任务来实现相互的流水掩盖
昇腾自定义算子	npu_dropout_add_layer_norm	支持自定义算子npu_dropout_add_layer_norm调用

不涉及

不涉及

已知问题	问题描述

A800-9010：CentOS 7.6/Ubuntu 18.04, 2.04/BC-Linux 7.6/Debian 9.9/Debian 10/OpenEuler 20.03 LTS

A800-9000：CentOS 7.6/Ubuntu 18.04, 2.04/Euler 2.8, 2.10/Kylin v10/BC-Linux 7.6/OpenEuler 20.03 LTS/UOS 20 1020e