Introduce样例介绍
概述
基于Ascend C的简单的示例,通过Ascend C编程语言实现了自定义算子,分别给出对应的<<<>>>直调实现,适合初学者
算子开发样例
| 目录名称 | 功能描述 |
|---|---|
| 00_helloworld | 样例介绍了基于Ascend C的HelloWorld算子的核函数直调方法,分别从NPU、AICPU测运行核验证算子核函数,展示核函数从调用到执行的整体流程 |
| 01_add | 本样例介绍了基于Ascend C的Add自定义Vector算子的核函数直调方法,实现两个输入张量的逐元素相加,支持main函数和kernel函数在同一个cpp文件中实现 |
| 02_matmul | 本样例介绍了基于Ascend C的Matmul算子的核函数直调方法,可最大化利用AI处理器的并行计算能力,显著提升算子的执行效率,使用与高性能推理与训练场景 |
| 03_matmulleakyrelu | 本样例介绍了基于Ascend C的MatmulLeakyRelu自定义算子的核函数直调方法,能够完成矩阵乘加与LeakyReLU激活的融合计算,该方式将关键计算步骤在硬件层面高效协同执行,显著降低内存访问开销与计算延时 |
| 04_simple_operator | 样例介绍了5个基于Ascend C的算子的核函数直调样例,涵盖AddN、Broadcast、Gather、Sub以及向量Add等典型算子,展示了动态Tensor、纯SIMT编程、临时缓冲区使用等关键技术,充分体现了Ascend C在高性能算子开发中的灵活性与高效性 |