Triton-Ascend 版本发布
Triton-Ascend 版本提供了一个稳定的代码基础快照,封装成可以通过 PyPI 轻松安装的二进制包。此外,版本发布代表着开发团队可以向社区正式宣布新功能的可用性、已完成的改进以及可能影响用户的变化(例如破坏性变更)。
发布兼容性矩阵
以下是 Triton-Ascend 版本的发布兼容性矩阵:
| Triton-Ascend 版本 | Python 版本 | Manylinux 版本 | 硬件平台 | 硬件产品 |
|---|---|---|---|---|
| 3.2.0 | >=3.9, <=3.11 | glibc 2.27+, x86-64, aarch64 | Ascend NPU | Atlas A2/A3 |
发布计划
以下是 Triton-Ascend 的发布计划。请注意:补丁版本是可选的。
| 主版本 | 发布分支切出时间 | 发布日期 | 补丁发布日期 |
|---|---|---|---|
| 3.2.0 | 2025年12月08日 | 2026年1月 | --- |
版本亮点
Triton-Ascend 3.2.0
首次发布:Ascend NPU 支持
Triton-Ascend 3.2.0 是第一个正式支持华为 Ascend NPU 的 Triton 版本。此版本基于 Triton 3.2.0 社区版本,专门适配 Ascend NPU 硬件架构。
主要特性
-
Ascend NPU 全栈支持
- 完整的 Triton IR 到 NPU 指令集编译流水线
- 支持全部 Triton Ops
-
性能优化
- NPU 特定内核优化
- CV 计算优化
-
开发者工具
- 支持全面的调试输出
- 编译中间产物转储
已知限制
- 数据类型: 部分数据类型支持仍在完善中
- 算子覆盖: 正在持续扩展支持的算子集合
迁移指南
对于现有 Triton GPU 用户迁移到 Ascend NPU,详见 GPU Triton算子迁移