版本说明
版本配套说明
产品版本信息
产品名称 |
Ascend Extension for PyTorch |
|---|---|
产品版本 |
26.0.0 |
版本类型 |
正式版本 |
发布时间 |
2026年4月 |
维护周期 |
参考分支维护策略 |
相关产品版本配套说明
Ascend Extension for PyTorch代码分支名称采用 {PyTorch版本}-{昇腾版本} 的命名规则,前者为Ascend Extension for PyTorch匹配的PyTorch版本,后者为Ascend Extension for PyTorch版本,详细匹配如下表:
| CANN版本 | PyTorch版本 | Ascend Extension for PyTorch版本 | Ascend Extension for PyTorch代码分支名称 | Ascend Extension for PyTorch安装包版本 | Python版本 |
|---|---|---|---|---|---|
| 商用版:9.0.0 社区版:9.0.0 |
2.7.1 | 26.0.0 | v2.7.1-26.0.0 | 2.7.1.post4 | Python3.9.x、Python3.10.x、Python3.11.x、Python3.12.x、Python3.13.x |
| 商用版:9.0.0 社区版:9.0.0 |
2.8.0 | 26.0.0 | v2.8.0-26.0.0 | 2.8.0.post4 | Python3.9.x、Python3.10.x、Python3.11.x、Python3.12.x、Python3.13.x |
| 商用版:9.0.0 社区版:9.0.0 |
2.9.0 | 26.0.0 | v2.9.0-26.0.0 | 2.9.0.post2 | Python3.10.x、Python3.11.x、Python3.12.x、Python3.13.x |
| 商用版:9.0.0 社区版:9.0.0 |
2.10.0 | 26.0.0 | v2.10.0-26.0.0 | 2.10.0 | Python3.10.x、Python3.11.x、Python3.12.x、Python3.13.x |
版本兼容性说明
| Ascend Extension for PyTorch版本 | CANN版本 | 网上相关产品版本兼容性 |
|---|---|---|
| 26.0.0 | CANN 9.0.0 CANN 8.5.0 CANN 8.3.RC1 CANN 8.2.RC1 CANN 8.1.RC1 |
- |
| 7.3.0 | CANN 8.5.0 CANN 8.3.RC1 CANN 8.2.RC1 CANN 8.1.RC1 CANN 8.0.0 |
Driving SDK 7.3.0兼容CANN 8.1.RC1、CANN 8.2.RC1、CANN 8.3.RC1、CANN 8.5.0 |
| 7.2.0 | CANN 8.3.RC1 CANN 8.2.RC1 CANN 8.1.RC1 CANN 8.0.0 CANN 8.0.RC3 CANN 8.0.RC2 |
Driving SDK 7.2.RC1兼容CANN 8.1.RC1、CANN 8.2.RC1、CANN 8.3.RC1 |
| 7.1.0 | CANN 8.3.RC1 CANN 8.2.RC1 CANN 8.1.RC1 CANN 8.0.0 CANN 8.0.RC3 CANN 8.0.RC2 |
Driving SDK 7.1.RC1兼容CANN 8.0.0、CANN 8.1.RC1和CANN 8.2.RC1 |
更新说明
新增特性
| 组件 | 描述 | 目的 |
|---|---|---|
| Ascend Extension for PyTorch(即torch-npu) | P2P通信支持group下发。 | batch_isend_irecv支持group下发方式。 |
| DTensor策略扩展。 | 新增多类算子切分支持,算子覆盖率提升至99%以上。 | |
| 跨流内存延迟释放优化。 | 在内存充足时,减少跨流内存释放状态查询开销,缩短运行时间,提升执行性能。 | |
| D2D拷贝的Event使用Pool管理。 | 对跨设备拷贝中的Event进行池化管理,减少频繁创建开销,提升性能。 | |
| Event能力增强,支持跨进程与跨设备使用。 | 在跨进程共享内存和跨设备拷贝场景中支持使用Event同步,提升整体性能。 | |
| host allocator支持背景线程优化query时间。 | 使用背景线程定时查询Event的完成情况,提升整体内存分配性能。 |
删除特性
无
接口变更说明
本章节的接口变更说明包括新增、修改、废弃和删除。接口变更只体现代码层面的修改,不包含文档本身在语言、格式、链接等方面的优化改进。
- 新增:表示此次版本新增的接口。
- 修改:表示本接口相比于上个版本有修改。
- 废弃:表示该接口自作出废弃声明的版本起停止演进,且在声明一年后可能被移除。
- 删除:表示该接口在此次版本被移除。
表 1 Ascend Extension for PyTorch接口变更汇总
| 变更版本 | 类名/API原型 | 类/API类别 | 变更类别 | 变更说明 |
|---|---|---|---|---|
| v2.7.1 | torch_npu.npu.NpuGraphOpHandler | 自定义接口 | 新增 | • torch_npu功能重构 • 不依赖特定的CANN版本 |
| torch_npu.npu_block_sparse_attention | 自定义接口 | 新增 | 依赖CANN 9.0.0版本 | |
| torch_npu.npu_dense_lightning_indexer_grad_kl_loss | 自定义接口 | 新增 | 依赖CANN 9.0.0版本 | |
| torch_npu.npu_dense_lightning_indexer_softmax_lse | 自定义接口 | 新增 | 依赖CANN 9.0.0版本 | |
| torch_npu.npu_fused_floyd_attention | 自定义接口 | 新增 | 依赖CANN 9.0.0版本 | |
| torch_npu.npu_fusion_attention_v3 | 自定义接口 | 新增 | 依赖CANN 9.0.0版本 | |
| torch_npu.npu_quant_matmul_gelu | 自定义接口 | 新增 | 依赖CANN 9.0.0版本 | |
| torch_npu.save_npugraph_tensor | 自定义接口 | 新增 | 依赖CANN 8.5.0及以上版本 | |
| torch_npu.npu_attention_to_ffn | 自定义接口 | 新增 | 依赖CANN 9.0.0版本 | |
| torch_npu.npu_attention_update | 自定义接口 | 新增 | 不依赖特定的CANN版本 | |
| torch_npu.npu_add_rms_norm | 自定义接口 | 新增 | 依赖CANN 9.0.0版本 | |
| torch_npu.npu_recurrent_gated_delta_rule | 自定义接口 | 新增 | 依赖CANN 9.0.0版本 | |
| torch_npu.npu.matmul.cube_math_type | 自定义接口 | 新增 | 依赖CANN 8.5.0及以上版本 | |
| torch_npu.npu_swiglu_quant | 自定义接口 | 新增 | 依赖CANN 9.0.0版本 | |
| torch_npu.npu_rms_norm_quant | 自定义接口 | 新增 | 依赖CANN 9.0.0版本 | |
| torch_npu.npu_add_rms_norm_quant | 自定义接口 | 新增 | 依赖CANN 8.3.0RC1及以上版本 | |
| torch_npu.npu_clipped_swiglu | 自定义接口 | 新增 | 不依赖特定的CANN版本 | |
| torch_npu.npu_fusion_attention | 自定义接口 | 修改 | • 新增dropout_mask、seed、offset可选参数 • 不依赖特定的CANN版本 |
|
| v2.8.0 | 变更同v2.7.1版本 | |||
| v2.9.0 | 变更同v2.7.1版本 | |||
| v2.10.0 | 变更同v2.7.1版本 | |||
Note
Ascend Extension for PyTorch新增部分API支持及特性支持,具体可参考《Ascend Extension for PyTorch 自定义API参考》或《PyTorch 原生API支持度》。
已解决问题
问题描述 |
现象:在特定场景下,可能出现NN process问题,导致两张IC(计算实例)网络发生OOM。 影响:部分环境中可能出现NN process报错。 |
|---|---|
严重级别 |
一般 |
根因分析 |
get_device_properties接口通过cudaGetDeviceProperties接口调用获取,NPU上调用多个接口获取对应属性。其中设备内存信息依赖aclGetMemInfo获取,但该接口必须绑定context才能调用,导致持续占用0卡内存。 |
解决方案 |
get_device_properties接口对齐aclrtGetMenInfo接口。 |
修改影响 |
修复后,get_device_properties接口对齐了aclrtGetMenInfo接口,消除了潜在的资源占用风险。 |
遗留问题
无
升级影响
升级过程中对现行系统的影响
-
对业务的影响
软件版本升级过程中会导致业务中断。
-
对网络通信的影响
对通信无影响。
升级后对现行系统的影响
无
版本配套文档
| 文档名称 | 内容简介 | 更新说明 |
|---|---|---|
| 《Ascend Extension for PyTorch 软件安装指南》 | 提供在昇腾设备安装PyTorch框架训练环境,以及升级、卸载等操作。 | • 新增适配PyTorch 2.10.0。 • 新增支持Python 3.13。 |
| 《PyTorch 训练模型迁移调优指南》 | 包含模型的迁移及调优、精度问题定位、性能问题解决等指导,并提供了常用模型案例库。 | 新增适配PyTorch 2.10.0。 |
| 《PyTorch 框架特性指南》 | 基于Ascend Extension for PyTorch提供昇腾AI处理器的超强算力,从内存优化、报错定位、高性能计算等方面打造一系列独有特性。 | • 新增“NPUGraph”相关内容。 • 更新“基于C++ extension算子适配开发”相关内容。 • 优化“基于OpPlugin算子适配开发”相关内容。 |
| 《PyTorch 图模式使用指南(TorchAir)》 | 作为昇腾Ascend Extension for PyTorch的图模式能力扩展库,提供昇腾设备亲和的torch.compile图模式后端,实现PyTorch网络在昇腾NPU上的图模式推理加速和优化。 | • 新增npugraph_ex后端的图模式,通过Capture&Replay方式实现任务一次捕获多次执行。原reduce-overhead模式通过config.mode配置图编辑后端的方式将不再演进,也不再推荐使用。 • 增强GE模式功能,包括指定dump算子范围、图内标定SuperKernel范围等。 |
| 《Ascend Extension for PyTorch 自定义API参考》 | 提供Ascend Extension for PyTorch自定义API的函数原型、功能说明、参数说明与调用示例等。 | • 新增适配PyTorch 2.10.0。 • 具体接口变更请参考接口变更说明。 |
| 《PyTorch 原生API支持度》 | 提供PyTorch 2.10.0/2.9.0/2.8.0/2.7.1版本原生API在昇腾设备上的支持情况。 | 新增PyTorch 2.10.0原生API支持清单。 |
| 《套件与三方库支持清单》 | 介绍昇腾设备支持的模型套件与加速库、昇腾已原生支持的第三方库和昇腾自研插件。 | 无新增。 |
| 《环境变量参考》 | 在Ascend Extension for PyTorch训练和在线推理过程中可使用的环境变量。 | • 新增“TORCH_NPU_USE_COMPATIBLE_IMPL”。 • 新增“TORCH_NPU_LOGS”。 • 新增“TORCH_NPU_LOGS_FILTER”。 • 新增“TORCH_NPU_DEVICE_CAPABILITY”。 • 新增“TORCH_TRANSFER_TO_NPU”。 • 新增“TORCHINDUCTOR_NPU_BACKEND”。 • 新增“INDUCTOR_ASCEND_CHECK_ACCURACY”。 |
病毒扫描及漏洞修补列表
病毒扫描结果
| 防病毒软件名称 | 防病毒软件版本 | 病毒库版本 | 扫描时间 | 扫描结果 |
|---|---|---|---|---|
| QiAnXin | 8.0.5.5260 | 2026-04-01 08:00:00.0 | 2026-04-02 | 无病毒,无恶意 |
| Kaspersky | 12.0.0.6672 | 2026-04-02 10:05:00.0 | 2026-04-02 | 无病毒,无恶意 |
| Bitdefender | 7.5.1.200224 | 7.100588 | 2026-04-02 | 无病毒,无恶意 |
漏洞修补列表
本版本无漏洞修复。