源码编译安装OpPlugin
安装说明
-
硬件配套表
昇腾训练设备包含以下型号,都可作为PyTorch模型的训练环境。
产品系列 产品型号 Atlas 训练系列产品 Atlas 800 训练服务器(型号:9000) Atlas 800 训练服务器(型号:9010) Atlas 900 PoD(型号:9000) Atlas 300T 训练卡(型号:9000) Atlas 300T Pro 训练卡(型号:9000) Atlas A2 训练系列产品 Atlas 800T A2 训练服务器 Atlas 900 A2 PoD 集群基础单元 Atlas 200T A2 Box16 异构子框 Atlas A3 训练系列产品 Atlas 800T A3 训练服务器 Atlas 900 A3 SuperPoD 超节点 昇腾推理设备包含以下型号,都可作为大模型的推理环境。
产品系列 产品型号 Atlas 800I A2推理产品 Atlas 800I A2 推理服务器 -
软件配套表
PyTorch Ascend Extension for PyTorch OpPlugin Python GCC 2.7.1 v2.7.1-26.0.0 26.0.0 3.9, 3.10, 3.11, 3.12, 3.13 11.2 2.8.0 v2.8.0-26.0.0 26.0.0 3.9, 3.10, 3.11, 3.12, 3.13 13.3 2.9.0 v2.9.0-26.0.0 26.0.0 3.10, 3.11, 3.12, 3.13 13.3 2.10.0 v2.10.0-26.0.0 26.0.0 3.10, 3.11, 3.12, 3.13 13.3
安装依赖
安装时需要安装系统依赖及官方PyTorch框架,建议使用torch_npu提供的docker镜像进行编译,依赖安装和镜像使用指导可参考Ascend Extension for Pytorch。
操作步骤
-
配置CANN环境变量脚本。
source <CANN软件安装目录>/<CANN软件路径>/set_env.sh环境变量脚本的默认路径一般为:/usr/local/npu/ascend-toolkit/set_env.sh,其中ascend-toolkit路径取决于安装的CANN软件名称。
-
编译生成插件的二进制安装包。
下载对应OpPlugin版本分支代码,进入插件根目录。
git clone --branch 26.0.0 https://gitcode.com/ascend/op-plugin.git cd op-plugin执行编译构建,以下命令以PyTorch版本2.7.1为例。
bash ci/build.sh --python=3.9 --pytorch=v2.7.1-26.0.0[!NOTICE] 编译时GCC和Python版本请参考软件配套表中约束。 编译过程中,会在插件根目录新建build文件夹,并下载torch_npu对应版本的源码,协同编译。 若build/pytorch目录存在,则编译op-plugin时,不再重复下载torch_npu源码。如需下载所依赖的最新torch_npu源码,删除build/pytorch目录即可。
-
完成编译后,安装dist目录下生成的插件torch_npu包,如果使用非root用户安装,需要在命令后加
--user。pip3 install --upgrade dist/torch_npu-{torch_npu_version}-{Python_version}-{arch}.whl # 实际执行时需要根据生成的whl包名称进行替换,其中{torch_npu_version}表示编译的torch_npu版本,{Python_version} 为所使用的 Python 版本,{arch} 则代表目标架构。 # 典型的whl包名类似:torch_npu-2.7.1.post13-cp38-cp38-manylinux_2_17_aarch64.manylinux2014_aarch64.whl
卸载
只需执行以下命令卸载 torch 即可:
pip uninstall torch_npu