Introduce样例介绍

概述

基于Ascend C的简单的示例,通过Ascend C编程语言实现了自定义算子,分别给出对应的<<<>>>直调实现,适合初学者

算子开发样例

目录名称 功能描述
00_quickstart 样例介绍了基于Ascend C的HelloWorld算子的核函数直调方法,从NPU侧运行核验证算子核函数,展示核函数从调用到执行的整体流程
01_add 本样例介绍了基于Ascend C的Add自定义Vector算子的核函数直调方法,实现两个输入张量的逐元素相加,支持main函数和kernel函数在同一个cpp文件中实现
02_matrix 本样例介绍了基于Ascend C的Matmul算子的核函数直调方法,可最大化利用AI处理器的并行计算能力,显著提升算子的执行效率,使用与高性能推理与训练场景
03_matrix_vector_fusion 本样例介绍了基于Ascend C的Matmul与Vector自定义融合算子的核函数直调方法,能够完成矩阵乘加与LeakyReLU激活的融合计算,以及SIMT Gather与SIMD Adds的融合计算,该方式将关键计算步骤在硬件层面高效协同执行,显著降低内存访问开销与计算延时
04_reg_base_add_compute 本样例介绍了基于Ascend C的Add算子核函数直调方法(RegBase场景),实现两个输入张量的逐元素相加,展示了片上存储和寄存器层级的向量计算流程。