安装指南
版本配套表
MindSpeed MM支持Atlas 800T A2等昇腾训练硬件形态。软件版本配套表如下:
| MindSpeed MM版本 | MindSpeed版本 | Megatron版本 | PyTorch版本 | torch_npu版本 | CANN版本 | Python版本 |
|---|---|---|---|---|---|---|
| master(主线) | master | Core 0.12.1 | 2.6.0, 2.7.1 | 在研版本 | 在研版本 | Python3.10 |
| 2.2.0(商用) | 2.2.0_core_r0.12.1 | Core 0.12.1 | 2.6.0, 2.7.1 | 7.2.0 | 8.3.RC1 | Python3.10 |
| 2.1.0(商用) | 2.1.0_core_r0.8.0 | Core 0.8.0 | 2.1.0, 2.6.0 | 7.1.0 | 8.2.RC1 | Python3.8, Python3.10 |
| 2.0.0(商用) | 2.0.0_core_r0.8.0 | Core 0.8.0 | 2.1.0 | 7.0.0 | 8.1.RC1 | Python3.8, Python3.10 |
| 1.0.0(商用) | 1.0.0_core_r0.6.0 | Core 0.6.0 | 2.1.0 | 6.0.0 | 8.0.0 | Python3.8, Python3.10 |
昇腾软件安装
1. 模型开发时推荐使用配套的环境版本
| 依赖软件 | 版本 |
|---|---|
| 昇腾NPU驱动 | Ascend HDK 25.3.RC1 |
| 昇腾NPU固件 | |
| Toolkit(开发套件) | CANN 8.3.RC1 |
| Kernel(算子包) | |
| NNAL(Ascend Transformer Boost加速库) | |
| Python | 3.10 |
| PyTorch | 2.6.0, 2.7.1 |
| torch_npu插件 | 7.2.0 |
2. 驱动固件安装
下载驱动固件,请根据系统和硬件产品型号选择对应版本的driver和firmware。参考安装NPU驱动固件或执行以下命令安装:
bash Ascend-hdk-*-npu-driver_*.run --full --force
bash Ascend-hdk-*-npu-firmware_*.run --full
3. CANN安装
下载CANN,请根据系统选择aarch64或x86_64对应版本的cann-toolkit、cann-kernel和cann-nnal。参考CANN安装或执行以下命令安装:
# 因为版本迭代,包名存在出入,根据实际修改
bash Ascend-cann-toolkit_8.3.RC1_linux-aarch64.run --install
bash Ascend-cann-kernels-*_8.3.RC1_linux-aarch64.run --install
source /usr/local/Ascend/ascend-toolkit/set_env.sh # 安装nnal包需要source环境变量
bash Ascend-cann-nnal_8.3.RC1_linux-aarch64.run --install
# 设置环境变量
source /usr/local/Ascend/ascend-toolkit/set_env.sh
source /usr/local/Ascend/nnal/atb/set_env.sh
4. PTA安装
准备torch_npu和apex,参考Ascend Extension for PyTorch 配置与安装或执行以下命令安装:
安装torch和torch_npu,以下以python 3.10 + torch 2.7.1为例:
conda create -n test python=3.10
conda activate test
# 注:若需安装torch2.6.0版本需要修改列对应whl包,并且修改 MindSpeed-MM/pyproject.toml中的torch版本为2.6.0
pip install torch-2.7.1-cp310-cp310*.whl
pip install torch_npu-2.7.1*-cp310-cp310*.whl