09_unalign样例介绍
概述
本样例路径以abs、reduce_min、whole_reduce_sum等算子为示例,展示了数据非32字节对齐场景中的处理方式,包括数据搬入,计算和搬出的处理。
算子开发样例
| 目录名称 | 功能描述 |
|---|---|
| abs_duplicate | 本样例介绍无DataCopyPad的非对齐abs_duplicate算子实现,采用核函数<<<>>>调用,有效降低调度开销,实现高效的算子执行 |
| abs_gather_mask | 本样例介绍无DataCopyPad的非对齐abs_gather_mask算子实现,采用核函数<<<>>>调用,有效降低调度开销,实现高效的算子执行 |
| abs_pad | 本样例介绍基于基础API实现abs_pad样例,展示了通过Pad一次性清零处理冗余数据 |
| abs_unpad | 本样例介绍基于基础API实现abs_unpad样例,展示了通过UnPad去除冗余数据的方法 |
| reduce_min | 本样例介绍无DataCopyPad的非对齐ReduceMin算子核函数直调方法,采用核函数<<<>>>调用,有效降低调度开销,实现高效的算子执行 |
| whole_reduce_sum | 本样例介绍非对齐WholeReduceSum算子的核函数直调方法,采用核函数<<<>>>调用,有效降低调度开销,实现高效的算子执行 |