Star
275
Fork
229
代码
介绍
代码
Issues
18
Pull Requests
37
流水线
Actions
讨论
Wiki
项目成员
70
分析
项目设置
Star
275
Fork
229
v9.0.0
pto-isa
/
docs
/
menu_ops_development.md
下载
cann-robot
docs: refine coding and ISA documentation
37752695
创建于
4月25日
历史提交
PTO虚拟指令集
产品介绍
什么是PTO
PTO ISA概述
支持的硬件平台
PTO与其他算子开发方式对比
开发环境准备
环境配置与安装
快速入门
第一个PTO算子
编程基础
编程模型
抽象机器模型
编程范式与约定
执行模型与内存层次
数据类型与状态模型
核心编程概念
Tile抽象
全局内存张量
事件与同步机制
标量与枚举类型
流水线与并行执行
算子开发实践
基础算子开发
向量加法示例
向量加法详解
矩阵乘法示例
矩阵乘法详解
Softmax算子详解
高级算子开发
Flash Attention算子
TopK算子
自定义算子开发
性能优化实践
GEMM性能优化
Flash Attention优化(A2/A3)
混合精度优化(MXFP8)
混合精度优化(MXFP4)
编译与部署
编译流程详解
算子集成到推理框架
测试与验证
测试框架说明
CPU仿真测试
NPU测试与验证
调试与优化
算子调试方法
性能分析与优化
性能调优最佳实践
内存优化技巧
进阶主题
汇编语言编程
汇编语法说明
C++内建函数参考
虚拟ISA与IR
字节码与工具链
内存顺序与一致性
多核并行编程
算子融合技术
附录
PTO虚拟ISA手册
术语表
示例代码索引
Kernel实现参考
常见错误码说明
版本兼容性说明