CHANGELOG

v9.0.0-beta.2

发布日期:2026/03/31

CANN版本 版本源码标签
CANN 9.0.0-beta.2 v9.0.0-beta.2

🚀 关键特性

  • Ascend 950PR支持SIMD编程模式,提供200+ API接口跨代兼容能力,可实现Atlas A2系列产品和Atlas A3系列产品算子平滑迁移。
  • Ascend 950PR新增基于Reg的编程方式,提供Reg数据搬运、基础算术、规约计算、同步控制等90+ Reg编程接口
  • Atlas A2系列产品、Atlas A3系列产品、Ascend 950PR支持语言扩展层纯C接口,支持数组式内存分配与指针型计算接口,提供原生纯 C 编程体验。
  • Ascend 950PR支持SIMD与SIMT混合编程,提供约700个SIMT API接口,包含warp、atomic、基本数学计算、类型转换等基础接口。
  • Ascend 950PR支持通信高阶API的CCU通信接口,提供基于CCU的Allreduce,Allgather,Reducescatter,AlltoAll等主流通信原语;Matmul高阶API新增支持MXFP4/8低比特数据类型的矩阵运算,实现内存占用减半、算力吞吐倍增。
  • Ascend 950PR新增及兼容支持样例共计约260个,包含SIMT样例、SIMD样例(框架类、基础API、高阶API、最佳实践等),并按照编程模型和样例类别对样例目录结构进行调整,提升样例目录结构的易读性。
  • 融合编译与<<<>>>调用方式支持CPU模式以及SIM仿真模式

📖 资料文档


v9.0.0-beta.1

发布日期:2026/02/25

CANN版本 版本源码标签
CANN 9.0.0-beta.1 v9.0.0-beta.1

🚀 关键特性


v8.5.0

发布日期:2026/01/23

CANN版本 版本源码标签
CANN 8.5.0 v8.5.0

🚀 关键特性

基于Atlas A3 训练系列产品/Atlas A3推理系列产品、Atlas A2训练系列产品/Atlas A2推理系列产品全面开源开放,包含以下新特性:

  • 实现分仓分包,支持分包独立安装部署,包括Ascend C算子开发所需的核心仓asc-devkit、调试工具仓asc-tools、Vector算子模板库仓atvcatvoss、Python前端仓pyasc
  • 编程API能力扩展
    • 新增语言扩展层C API,提供与业界相似的编程体验。
    • 基础API新增LocalMemAllocator内存分配接口。
  • 全面支持异构编译与<<<>>> 直调,通过文件后缀名“.asc”或编译选项“-x asc”使能异构编译。
  • 算子编译CMake接口标准化,提供Cmake module接口,支持不同编译场景。
  • 支持CPU&NPU孪生调试的能力一致性,一套代码同时支持CPU和NPU调试。
  • 编程指南全面优化。
  • 新增算子样例。