安装说明
本文主要向用户介绍如何快速基于PyTorch框架以及MindSpore框架完成MindSpeed MM(多模态模型套件)的安装。
硬件配套和支持的操作系统
表 1 产品硬件支持列表
| 产品 | 是否支持(训练场景) |
|---|---|
| Atlas A3 训练系列产品 | √ |
| Atlas A3 推理系列产品 | x |
| Atlas A2 训练系列产品 | √ |
| Atlas A2 推理系列产品 | x |
| Atlas 200I/500 A2 推理产品 | x |
| Atlas 推理系列产品 | x |
| Atlas 训练系列产品 | √ |
Note
本节表格中“√”代表支持,“x”代表不支持。
-
各硬件产品对应物理机部署场景支持的操作系统请参考兼容性查询助手。
-
各硬件产品对应虚拟机部署场景支持的操作系统请参考《CANN 软件安装指南》的“操作系统兼容性说明”章节(商用版)或“操作系统兼容性说明”章节(社区版)。
-
各硬件产品对应容器部署场景支持的操作系统请参考《CANN 软件安装指南》的“操作系统兼容性说明”章节(商用版)或“操作系统兼容性说明”章节(社区版)。
安装前准备
请参见《版本说明》中的“相关产品版本配套说明”章节,下载安装对应的软件版本。
安装驱动固件
下载驱动固件,请根据系统和硬件产品型号选择对应版本的driver和firmware。参考安装NPU驱动固件或执行以下命令安装:
chmod +x Ascend-hdk-<chip_type>-npu-driver_<version>_linux-<arch>.run
chmod +x Ascend-hdk-<chip_type>-npu-firmware_<version>.run
./Ascend-hdk-<chip_type>-npu-driver_<version>_linux-<arch>.run --full --force
./Ascend-hdk-<chip_type>-npu-firmware_<version>.run --full
安装CANN
获取CANN,安装配套版本的Toolkit、ops和NNAL并配置CANN环境变量。具体请参考《CANN 软件安装指南》(商用版)或《CANN 软件安装指南》(社区版)。
#基于PyTorch框架设置环境变量
source /usr/local/Ascend/cann/set_env.sh # 修改为实际安装的Toolkit包路径
source /usr/local/Ascend/nnal/atb/set_env.sh # 修改为实际安装的nnal包路径
#基于MindSpore框架设置环境变量
source /usr/local/Ascend/cann/set_env.sh # 修改为实际安装的Toolkit包路径
source /usr/local/Ascend/nnal/atb/set_env.sh --cxx_abi=0 # 修改为实际安装的nnal包路径
[!NOTICE] 建议使用非root用户安装运行torch_npu,且建议对安装程序的目录文件做好权限管控:文件夹权限设置为750,文件权限设置为640。可以通过设置umask控制安装后文件的权限,如设置umask为0027。 更多安全相关内容请参见《安全声明》中各组件关于“文件权限控制”的说明。
基于PyTorch框架
安装PyTorch以及torch_npu
请参考《Ascend Extension for PyTorch 软件安装指南》中的“安装PyTorch框架”章节,获取配套版本的PyTorch以及torch_npu软件包。 可参考如下安装命令:
# 安装torch和torch_npu 构建参考 https://gitcode.com/ascend/pytorch/releases
pip3 install torch-2.7.1-cp310-cp310-manylinux_2_28_aarch64.whl
pip3 install torch_npu-2.7.1rc1-cp310-cp310-manylinux_2_28_aarch64.whl
安装MindSpeed MM
安装MindSpeed MM有如下两种方式:
- 手动安装:灵活指定需要使用的第三方依赖及MindSpeed MM。
- 一键安装:快速安装最新配套的第三方依赖及MindSpeed MM,当前只有qwen3,qwen3.5模型支持,请按照实际需求选择。
一键安装
一键式命令会依次安装PyTorch、torch_npu、Megatron-LM、MindSpeed、MindSpeed MM。由于Megatron-LM对于pip install安装方式适配性待提升,采用源码拷贝方式进行使用。
以Qwen3.5模型安装为例:
-
获取MindSpeed MM代码仓,并进入代码仓根目录:
git clone https://gitcode.com/Ascend/MindSpeed-MM.git cd MindSpeed-MM git checkout 26.0.0 -
执行如下指令一键安装:
bash scripts/install.sh --msid eb10b92 && bash examples/qwen3_5/install_extensions.sh表 2 scripts/install.sh文件选项参数表
参数名称 说明 是否必选 取值范围 -t, --torchversion 表示当前使用的torch版本 否 2.6.0或2.7.1 -m, --msid 表示当前基于源码安装的MindSpeed加速库的commit id 是 MindSpeed最新商用分支commit id -y, --yes 确认所有软件重新安装 否 - -n, --no 自动跳过第三依赖安装 否 - -mt, --megatron 安装Megatron-LM 否 默认安装版本Megatron-LM 0.12.0 -ic, --install-cann 安装CANN 否 默认安装版本CANN 8.5.0 -h, --help 显示安装帮助 否 - -
如已安装了PyTorch或torch_npu,请按以下步骤操作;未安装可跳过本步骤:
控制台打印了如下信息,表示检测到环境中已经安装了2.6.0版本的PyTorch和torch_npu。如果您希望安装新版本的PyTorch和torch_npu,请输入
y;如果希望保持已安装的PyTorch和torch_npu,请输入n。Version check results: Currently installed torch version: 2.6.0, target version: 2.7.1 Currently installed torch_npu version: 2.6.0, target version: 2.7.1 Version mismatch detected. Continue installation? (y/n) -
检查安装是否成功,若控制台打印如下信息,说明安装成功:
mindspeed mm successfully installed!
手动安装
该方法适用于单独安装PyTorch和其他第三方库进行开发调试的用户使用。
-
激活环境:
# 激活上面构建的Python3.10版本的环境 conda create -n test python=3.10 conda activate test -
获取MindSpeed MM和Megatron-LM源码。
git clone https://gitcode.com/Ascend/MindSpeed-MM.git git clone https://github.com/NVIDIA/Megatron-LM.git cd Megatron-LM git checkout core_v0.12.1 cp -r megatron ../MindSpeed-MM/ cd .. cd MindSpeed-MM -
获取MindSpeed加速库源码并安装。
# 获取源码 git clone https://gitcode.com/Ascend/MindSpeed.git # 根据需要切换到特定的分支或commitid cd MindSpeed git checkout 26.0.0_core_r0.12.1 # 安装加速库 pip install -r requirements.txt pip install -e . cd .. -
安装MindSpeed MM及其相关依赖,可通过pyproject.toml配置第三方依赖清单。
pip install -e .
基于MindSpore框架
安装MindSpore
参考MindSpore官方安装指导,根据系统类型、CANN版本及Python版本获取相应的安装命令以安装MindSpore 2.9.0,安装前请确保网络畅通。
一键式适配MindSpeed MM
针对MindSpore框架,我们提供了一键转换工具MindSpeed-Core-MS,旨在帮助用户自动拉取相关代码仓并对torch代码进行一键适配,进而使用户无需再额外手动开发适配即可在MindSpore+CANN环境下一键拉起模型训练。
git clone https://gitcode.com/Ascend/MindSpeed-Core-MS.git -b master
cd MindSpeed-Core-MS
pip install -r requirements.txt
source auto_convert.sh mm
cd MindSpeed-MM