安装指南

版本配套表

MindSpeed MM支持Atlas 800T A2等昇腾训练硬件形态。软件版本配套表如下:

MindSpeed MM版本 MindSpeed版本 Megatron版本 PyTorch版本 torch_npu版本 CANN版本 Python版本
master(主线) master Core 0.12.1 2.6.0, 2.7.1 在研版本 在研版本 Python3.10
2.3.0(商用) 2.3.0_core_r0.12.1 Core 0.12.1 2.6.0, 2.7.1 7.3.0 8.5.0 Python3.10
2.2.0(商用) 2.2.0_core_r0.12.1 Core 0.12.1 2.6.0, 2.7.1 7.2.0 8.3.RC1 Python3.10
2.1.0(商用) 2.1.0_core_r0.8.0 Core 0.8.0 2.1.0, 2.6.0 7.1.0 8.2.RC1 Python3.8, Python3.10
2.0.0(商用) 2.0.0_core_r0.8.0 Core 0.8.0 2.1.0 7.0.0 8.1.RC1 Python3.8, Python3.10
1.0.0(商用) 1.0.0_core_r0.6.0 Core 0.6.0 2.1.0 6.0.0 8.0.0 Python3.8, Python3.10

昇腾软件安装

1. 模型开发时推荐使用配套的环境版本

依赖软件 版本
昇腾NPU驱动 Ascend HDK 25.5.0
昇腾NPU固件
Toolkit(开发套件) CANN 8.5.0
Ops(算子包)
NNAL(Ascend Transformer Boost加速库)
Python 3.10
PyTorch 2.6.0, 2.7.1
torch_npu插件 7.3.0

2. 驱动固件安装

下载驱动固件,请根据系统和硬件产品型号选择对应版本的driverfirmware。参考安装NPU驱动固件或执行以下命令安装:

bash Ascend-hdk-*-npu-driver_*.run --full --force
bash Ascend-hdk-*-npu-firmware_*.run --full

3. CANN安装

下载CANN,请根据系统选择aarch64x86_64对应版本的cann-toolkitcann-kernelcann-nnal。参考CANN安装或执行以下命令安装:

# 因为版本迭代,包名存在出入,根据实际修改
bash Ascend-cann-toolkit_8.5.0_linux-aarch64.run --install
bash Ascend-cann-*-ops_8.5.0_linux-aarch64.run --install
source /usr/local/Ascend/cann/set_env.sh # 安装nnal包需要source环境变量
bash Ascend-cann-nnal_8.5.0_linux-aarch64.run --install
# 设置环境变量
source /usr/local/Ascend/cann/set_env.sh
source /usr/local/Ascend/nnal/atb/set_env.sh

4. PTA安装

准备torch_npu,参考Ascend Extension for PyTorch 配置与安装或执行以下命令安装:

安装torch和torch_npu,以下以python 3.10 + torch 2.7.1为例:

conda create -n test python=3.10
conda activate test
# 注:若需安装torch2.6.0版本需要修改列对应whl包,并且修改 MindSpeed-MM/pyproject.toml中的torch版本为2.6.0
pip install torch-2.7.1-cp310-cp310*.whl 
pip install torch_npu-2.7.1*-cp310-cp310*.whl