安装说明

本文主要向用户介绍如何快速基于PyTorch框架以及MindSpore框架完成MindSpeed MM(多模态模型套件)的安装。

硬件配套和支持的操作系统

表 1 产品硬件支持列表

产品 是否支持(训练场景)
Atlas A3 训练系列产品
Atlas A3 推理系列产品 x
Atlas A2 训练系列产品
Atlas A2 推理系列产品 x
Atlas 200I/500 A2 推理产品 x
Atlas 推理系列产品 x
Atlas 训练系列产品

Note

本节表格中“√”代表支持,“x”代表不支持。

安装前准备

请参见《版本说明》中的“相关产品版本配套说明”章节,下载安装对应的软件版本。

安装驱动固件

下载驱动固件,请根据系统和硬件产品型号选择对应版本的driverfirmware。参考安装NPU驱动固件或执行以下命令安装:

chmod +x Ascend-hdk-<chip_type>-npu-driver_<version>_linux-<arch>.run
chmod +x Ascend-hdk-<chip_type>-npu-firmware_<version>.run
./Ascend-hdk-<chip_type>-npu-driver_<version>_linux-<arch>.run --full --force
./Ascend-hdk-<chip_type>-npu-firmware_<version>.run --full

安装CANN

获取CANN,安装配套版本的Toolkit、ops和NNAL并配置CANN环境变量。具体请参考《CANN 软件安装指南》(商用版)或《CANN 软件安装指南》(社区版)。

#基于PyTorch框架设置环境变量
source /usr/local/Ascend/cann/set_env.sh # 修改为实际安装的Toolkit包路径
source /usr/local/Ascend/nnal/atb/set_env.sh # 修改为实际安装的nnal包路径
#基于MindSpore框架设置环境变量
source /usr/local/Ascend/cann/set_env.sh # 修改为实际安装的Toolkit包路径
source /usr/local/Ascend/nnal/atb/set_env.sh --cxx_abi=0 # 修改为实际安装的nnal包路径

[!NOTICE] 建议使用非root用户安装运行torch_npu,且建议对安装程序的目录文件做好权限管控:文件夹权限设置为750,文件权限设置为640。可以通过设置umask控制安装后文件的权限,如设置umask为0027。 更多安全相关内容请参见《安全声明》中各组件关于“文件权限控制”的说明。

基于PyTorch框架

安装PyTorch以及torch_npu

请参考《Ascend Extension for PyTorch 软件安装指南》中的“安装PyTorch框架”章节,获取配套版本的PyTorch以及torch_npu软件包。 可参考如下安装命令:

# 安装torch和torch_npu 构建参考 https://gitcode.com/ascend/pytorch/releases
pip3 install torch-2.7.1-cp310-cp310-manylinux_2_28_aarch64.whl
pip3 install torch_npu-2.7.1rc1-cp310-cp310-manylinux_2_28_aarch64.whl

安装MindSpeed MM

安装MindSpeed MM有如下两种方式:

  • 手动安装:灵活指定需要使用的第三方依赖及MindSpeed MM。
  • 一键安装:快速安装最新配套的第三方依赖及MindSpeed MM,当前只有qwen3,qwen3.5模型支持,请按照实际需求选择。

一键安装

目前Qwen3-VLqwen3.5模型已支持一键安装。

一键式命令会依次安装PyTorchtorch_npuMegatron-LMMindSpeedMindSpeed MM。由于Megatron-LM对于pip install安装方式适配性待提升,采用源码拷贝方式进行使用。

以Qwen3.5模型安装为例:

  1. 获取MindSpeed MM代码仓,并进入代码仓根目录:

      git clone https://gitcode.com/Ascend/MindSpeed-MM.git
      cd MindSpeed-MM
      git checkout 26.0.0
    
  2. 执行如下指令一键安装:

      bash scripts/install.sh --msid eb10b92 && bash examples/qwen3_5/install_extensions.sh
    

    表 2 scripts/install.sh文件选项参数表

    参数名称 说明 是否必选 取值范围
    -t, --torchversion 表示当前使用的torch版本 2.6.0或2.7.1
    -m, --msid 表示当前基于源码安装的MindSpeed加速库的commit id MindSpeed最新商用分支commit id
    -y, --yes 确认所有软件重新安装 -
    -n, --no 自动跳过第三依赖安装 -
    -mt, --megatron 安装Megatron-LM 默认安装版本Megatron-LM 0.12.0
    -ic, --install-cann 安装CANN 默认安装版本CANN 8.5.0
    -h, --help 显示安装帮助 -
  3. 如已安装了PyTorch或torch_npu,请按以下步骤操作;未安装可跳过本步骤:

    控制台打印了如下信息,表示检测到环境中已经安装了2.6.0版本的PyTorch和torch_npu。如果您希望安装新版本的PyTorch和torch_npu,请输入y;如果希望保持已安装的PyTorch和torch_npu,请输入n

    Version check results:
    Currently installed torch version: 2.6.0, target version: 2.7.1
    Currently installed torch_npu version: 2.6.0, target version: 2.7.1
    Version mismatch detected. Continue installation? (y/n)
    
  4. 检查安装是否成功,若控制台打印如下信息,说明安装成功:

    mindspeed mm successfully installed!
    

手动安装

该方法适用于单独安装PyTorch和其他第三方库进行开发调试的用户使用。

  1. 激活环境:

    # 激活上面构建的Python3.10版本的环境
    conda create -n test python=3.10
    conda activate test
    
  2. 获取MindSpeed MM和Megatron-LM源码。

      git clone https://gitcode.com/Ascend/MindSpeed-MM.git
      git clone https://github.com/NVIDIA/Megatron-LM.git
      cd Megatron-LM
      git checkout core_v0.12.1
      cp -r megatron ../MindSpeed-MM/
      cd ..
      cd MindSpeed-MM
    
  3. 获取MindSpeed加速库源码并安装。

        # 获取源码
        git clone https://gitcode.com/Ascend/MindSpeed.git
        # 根据需要切换到特定的分支或commitid
        cd MindSpeed
        git checkout 26.0.0_core_r0.12.1
        # 安装加速库
        pip install -r requirements.txt
        pip install -e .
        cd ..
    
  4. 安装MindSpeed MM及其相关依赖,可通过pyproject.toml配置第三方依赖清单。

      pip install -e .
    

基于MindSpore框架

安装MindSpore

参考MindSpore官方安装指导,根据系统类型、CANN版本及Python版本获取相应的安装命令以安装MindSpore 2.9.0,安装前请确保网络畅通。

一键式适配MindSpeed MM

针对MindSpore框架,我们提供了一键转换工具MindSpeed-Core-MS,旨在帮助用户自动拉取相关代码仓并对torch代码进行一键适配,进而使用户无需再额外手动开发适配即可在MindSpore+CANN环境下一键拉起模型训练。

git clone https://gitcode.com/Ascend/MindSpeed-Core-MS.git -b master
cd MindSpeed-Core-MS
pip install -r requirements.txt
source auto_convert.sh mm
cd MindSpeed-MM