Reg矢量计算API样例
概述
通过Reg矢量计算API实现自定义算子,分别给出对应的<<<>>>直调实现。
算子开发样例
| 目录名称 | 功能描述 |
|---|---|
| move_mask_reg | 本样例演示了SIMD场景下,基于RegBase编程范式下数据从UB到MaskReg之间的搬入搬出。 |
| move_successive_align | 本样例演示了SIMD场景下,基于RegBase编程范式的连续对齐搬运算子的核函数直调方法,算子支持单核运行。 |
| move_successive_unalign | 本样例演示了SIMD场景下,基于RegBase编程范式的连续非对齐搬运算子的核函数直调方法,算子支持单核运行。 |
| move_unsuccessive_align | 本样例演示了SIMD场景下,基于RegBase编程范式的非连续对齐搬运算子的核函数直调方法,算子支持单核运行。 |
| read_write_sync | 本样例演示了SIMD场景下,基于RegBase编程范式下读操作与写操作之间依赖场景下的同步,样例中使用到了寄存器保序这一关键特性,可以优化读写之间的同步指令。 |
| vector_add | 本样例演示了SIMD场景下,基于RegBase编程范式的Add算子的核函数直调方法,算子支持单核运行,不同流水线之间使用VEC_LOAD和VEC_TORE同步。 |
| write_write_sync | 本样例演示了SIMD场景下,基于RegBase编程范式下写操作与写操作之间依赖场景下的同步。 |