Star275
229
代码介绍
代码
Issues18
Pull Requests37
流水线
Actions
讨论
Wiki
项目成员70
分析
项目设置
Star275
229
  1. pto-isa
  2. /
  3. docs
  4. /
  5. menu_ops_development.md
cann-robotcann-robotdocs: refine coding and ISA documentation
37752695创建于 4月25日历史提交

PTO虚拟指令集

  • 产品介绍
    • 什么是PTO
    • PTO ISA概述
    • 支持的硬件平台
    • PTO与其他算子开发方式对比
  • 开发环境准备
    • 环境配置与安装
    • 快速入门
    • 第一个PTO算子
  • 编程基础
    • 编程模型
    • 抽象机器模型
    • 编程范式与约定
    • 执行模型与内存层次
    • 数据类型与状态模型
  • 核心编程概念
    • Tile抽象
    • 全局内存张量
    • 事件与同步机制
    • 标量与枚举类型
    • 流水线与并行执行
  • 算子开发实践
    • 基础算子开发
      • 向量加法示例
      • 向量加法详解
      • 矩阵乘法示例
      • 矩阵乘法详解
      • Softmax算子详解
    • 高级算子开发
      • Flash Attention算子
      • TopK算子
      • 自定义算子开发
    • 性能优化实践
      • GEMM性能优化
      • Flash Attention优化(A2/A3)
      • 混合精度优化(MXFP8)
      • 混合精度优化(MXFP4)
  • 编译与部署
    • 编译流程详解
    • 算子集成到推理框架
  • 测试与验证
    • 测试框架说明
    • CPU仿真测试
    • NPU测试与验证
  • 调试与优化
    • 算子调试方法
    • 性能分析与优化
    • 性能调优最佳实践
    • 内存优化技巧
  • 进阶主题
    • 汇编语言编程
    • 汇编语法说明
    • C++内建函数参考
    • 虚拟ISA与IR
    • 字节码与工具链
    • 内存顺序与一致性
    • 多核并行编程
    • 算子融合技术
  • 附录
    • PTO虚拟ISA手册
    • 术语表
    • 示例代码索引
    • Kernel实现参考
    • 常见错误码说明
    • 版本兼容性说明