版本说明

版本配套说明

产品版本信息

产品名称

Ascend Extension for PyTorch

产品版本

26.0.0

版本类型

正式版本

发布时间

2026年4月

维护周期

参考分支维护策略

相关产品版本配套说明

Ascend Extension for PyTorch代码分支名称采用 {PyTorch版本}-{昇腾版本} 的命名规则,前者为Ascend Extension for PyTorch匹配的PyTorch版本,后者为Ascend Extension for PyTorch版本,详细匹配如下表:

CANN版本 PyTorch版本 Ascend Extension for PyTorch版本 Ascend Extension for PyTorch代码分支名称 Ascend Extension for PyTorch安装包版本 Python版本
商用版:9.0.0
社区版:9.0.0
2.7.1 26.0.0 v2.7.1-26.0.0 2.7.1.post4 Python3.9.x、Python3.10.x、Python3.11.x、Python3.12.x、Python3.13.x
商用版:9.0.0
社区版:9.0.0
2.8.0 26.0.0 v2.8.0-26.0.0 2.8.0.post4 Python3.9.x、Python3.10.x、Python3.11.x、Python3.12.x、Python3.13.x
商用版:9.0.0
社区版:9.0.0
2.9.0 26.0.0 v2.9.0-26.0.0 2.9.0.post2 Python3.10.x、Python3.11.x、Python3.12.x、Python3.13.x
商用版:9.0.0
社区版:9.0.0
2.10.0 26.0.0 v2.10.0-26.0.0 2.10.0 Python3.10.x、Python3.11.x、Python3.12.x、Python3.13.x

版本兼容性说明

Ascend Extension for PyTorch版本 CANN版本 网上相关产品版本兼容性
26.0.0 CANN 9.0.0
CANN 8.5.0
CANN 8.3.RC1
CANN 8.2.RC1
CANN 8.1.RC1
-
7.3.0 CANN 8.5.0
CANN 8.3.RC1
CANN 8.2.RC1
CANN 8.1.RC1
CANN 8.0.0
Driving SDK 7.3.0兼容CANN 8.1.RC1、CANN 8.2.RC1、CANN 8.3.RC1、CANN 8.5.0
7.2.0 CANN 8.3.RC1
CANN 8.2.RC1
CANN 8.1.RC1
CANN 8.0.0
CANN 8.0.RC3
CANN 8.0.RC2
Driving SDK 7.2.RC1兼容CANN 8.1.RC1、CANN 8.2.RC1、CANN 8.3.RC1
7.1.0 CANN 8.3.RC1
CANN 8.2.RC1
CANN 8.1.RC1
CANN 8.0.0
CANN 8.0.RC3
CANN 8.0.RC2
Driving SDK 7.1.RC1兼容CANN 8.0.0、CANN 8.1.RC1和CANN 8.2.RC1

更新说明

新增特性

组件 描述 目的
Ascend Extension for PyTorch(即torch-npu) P2P通信支持group下发。 batch_isend_irecv支持group下发方式。
DTensor策略扩展。 新增多类算子切分支持,算子覆盖率提升至99%以上。
跨流内存延迟释放优化。 在内存充足时,减少跨流内存释放状态查询开销,缩短运行时间,提升执行性能。
D2D拷贝的Event使用Pool管理。 对跨设备拷贝中的Event进行池化管理,减少频繁创建开销,提升性能。
Event能力增强,支持跨进程与跨设备使用。 在跨进程共享内存和跨设备拷贝场景中支持使用Event同步,提升整体性能。
host allocator支持背景线程优化query时间。 使用背景线程定时查询Event的完成情况,提升整体内存分配性能。

删除特性

接口变更说明

本章节的接口变更说明包括新增、修改、废弃和删除。接口变更只体现代码层面的修改,不包含文档本身在语言、格式、链接等方面的优化改进。

  • 新增:表示此次版本新增的接口。
  • 修改:表示本接口相比于上个版本有修改。
  • 废弃:表示该接口自作出废弃声明的版本起停止演进,且在声明一年后可能被移除。
  • 删除:表示该接口在此次版本被移除。

表 1 Ascend Extension for PyTorch接口变更汇总

变更版本 类名/API原型 类/API类别 变更类别 变更说明
v2.7.1 torch_npu.npu.NpuGraphOpHandler 自定义接口 新增 • torch_npu功能重构
• 不依赖特定的CANN版本
torch_npu.npu_block_sparse_attention 自定义接口 新增 依赖CANN 9.0.0版本
torch_npu.npu_dense_lightning_indexer_grad_kl_loss 自定义接口 新增 依赖CANN 9.0.0版本
torch_npu.npu_dense_lightning_indexer_softmax_lse 自定义接口 新增 依赖CANN 9.0.0版本
torch_npu.npu_fused_floyd_attention 自定义接口 新增 依赖CANN 9.0.0版本
torch_npu.npu_fusion_attention_v3 自定义接口 新增 依赖CANN 9.0.0版本
torch_npu.npu_quant_matmul_gelu 自定义接口 新增 依赖CANN 9.0.0版本
torch_npu.save_npugraph_tensor 自定义接口 新增 依赖CANN 8.5.0及以上版本
torch_npu.npu_attention_to_ffn 自定义接口 新增 依赖CANN 9.0.0版本
torch_npu.npu_attention_update 自定义接口 新增 不依赖特定的CANN版本
torch_npu.npu_add_rms_norm 自定义接口 新增 依赖CANN 9.0.0版本
torch_npu.npu_recurrent_gated_delta_rule 自定义接口 新增 依赖CANN 9.0.0版本
torch_npu.npu.matmul.cube_math_type 自定义接口 新增 依赖CANN 8.5.0及以上版本
torch_npu.npu_swiglu_quant 自定义接口 新增 依赖CANN 9.0.0版本
torch_npu.npu_rms_norm_quant 自定义接口 新增 依赖CANN 9.0.0版本
torch_npu.npu_add_rms_norm_quant 自定义接口 新增 依赖CANN 8.3.0RC1及以上版本
torch_npu.npu_clipped_swiglu 自定义接口 新增 不依赖特定的CANN版本
torch_npu.npu_fusion_attention 自定义接口 修改 • 新增dropout_mask、seed、offset可选参数
• 不依赖特定的CANN版本
v2.8.0 变更同v2.7.1版本
v2.9.0 变更同v2.7.1版本
v2.10.0 变更同v2.7.1版本

Note

Ascend Extension for PyTorch新增部分API支持及特性支持,具体可参考《Ascend Extension for PyTorch 自定义API参考》或《PyTorch 原生API支持度》。

已解决问题

问题描述

现象:在特定场景下,可能出现NN process问题,导致两张IC(计算实例)网络发生OOM。

影响:部分环境中可能出现NN process报错。

严重级别

一般

根因分析

get_device_properties接口通过cudaGetDeviceProperties接口调用获取,NPU上调用多个接口获取对应属性。其中设备内存信息依赖aclGetMemInfo获取,但该接口必须绑定context才能调用,导致持续占用0卡内存。

解决方案

get_device_properties接口对齐aclrtGetMenInfo接口。

修改影响

修复后,get_device_properties接口对齐了aclrtGetMenInfo接口,消除了潜在的资源占用风险。

遗留问题

升级影响

升级过程中对现行系统的影响

  • 对业务的影响

    软件版本升级过程中会导致业务中断。

  • 对网络通信的影响

    对通信无影响。

升级后对现行系统的影响

版本配套文档

文档名称 内容简介 更新说明
Ascend Extension for PyTorch 软件安装指南 提供在昇腾设备安装PyTorch框架训练环境,以及升级、卸载等操作。 • 新增适配PyTorch 2.10.0。
• 新增支持Python 3.13。
PyTorch 训练模型迁移调优指南 包含模型的迁移及调优、精度问题定位、性能问题解决等指导,并提供了常用模型案例库。 新增适配PyTorch 2.10.0。
PyTorch 框架特性指南 基于Ascend Extension for PyTorch提供昇腾AI处理器的超强算力,从内存优化、报错定位、高性能计算等方面打造一系列独有特性。 • 新增“NPUGraph”相关内容。
• 更新“基于C++ extension算子适配开发”相关内容。
• 优化“基于OpPlugin算子适配开发”相关内容。
PyTorch 图模式使用指南(TorchAir) 作为昇腾Ascend Extension for PyTorch的图模式能力扩展库,提供昇腾设备亲和的torch.compile图模式后端,实现PyTorch网络在昇腾NPU上的图模式推理加速和优化。 • 新增npugraph_ex后端的图模式,通过Capture&Replay方式实现任务一次捕获多次执行。原reduce-overhead模式通过config.mode配置图编辑后端的方式将不再演进,也不再推荐使用。
• 增强GE模式功能,包括指定dump算子范围、图内标定SuperKernel范围等。
Ascend Extension for PyTorch 自定义API参考 提供Ascend Extension for PyTorch自定义API的函数原型、功能说明、参数说明与调用示例等。 • 新增适配PyTorch 2.10.0。
• 具体接口变更请参考接口变更说明
PyTorch 原生API支持度 提供PyTorch 2.10.0/2.9.0/2.8.0/2.7.1版本原生API在昇腾设备上的支持情况。 新增PyTorch 2.10.0原生API支持清单。
套件与三方库支持清单 介绍昇腾设备支持的模型套件与加速库、昇腾已原生支持的第三方库和昇腾自研插件。 无新增。
环境变量参考 在Ascend Extension for PyTorch训练和在线推理过程中可使用的环境变量。 • 新增“TORCH_NPU_USE_COMPATIBLE_IMPL”。
• 新增“TORCH_NPU_LOGS”。
• 新增“TORCH_NPU_LOGS_FILTER”。
• 新增“TORCH_NPU_DEVICE_CAPABILITY”。
• 新增“TORCH_TRANSFER_TO_NPU”。
• 新增“TORCHINDUCTOR_NPU_BACKEND”。
• 新增“INDUCTOR_ASCEND_CHECK_ACCURACY”。

病毒扫描及漏洞修补列表

病毒扫描结果

防病毒软件名称 防病毒软件版本 病毒库版本 扫描时间 扫描结果
QiAnXin 8.0.5.5260 2026-04-01 08:00:00.0 2026-04-02 无病毒,无恶意
Kaspersky 12.0.0.6672 2026-04-02 10:05:00.0 2026-04-02 无病毒,无恶意
Bitdefender 7.5.1.200224 7.100588 2026-04-02 无病毒,无恶意

漏洞修补列表

本版本无漏洞修复。