激活函数算子样例介绍
概述
本样例集介绍了激活函数在算子不同特性的典型用法,给出了对应的端到端实现。
算子开发样例
| 目录名称 | 功能描述 |
|---|---|
| adjustsoftmaxres | 本样例介绍了调用AdjustSoftMaxRes高阶API实现AdjustSoftMaxRes算子,并按照核函数直调的方式给出了对应的端到端实现 |
| fastergelu | 本样例介绍了调用FasterGelu高阶API实现fastergelu单算子,主要演示FasterGelu高阶API在Kernel直调工程中的调用 |
| fastergeluv2 | 本样例演示了基于FasterGeluV2高阶API实现的算子实现。样例采用的FastGeluV2版本能降低GELU的算力需求 |
| geglu | 本样例演示了基于GeGLU高阶API的算子实现。GELU是一个重要的激活函数,灵感来源于Relu和Dropout,在激活中引入了随机正则的思想 |
| logsoftmax | 本样例演示了基于LogSoftMax高阶API的算子实现。样例对输入tensor做LogSoftmax计算 |
| reglu | 本样例演示了基于ReGLU高阶API的算子实现。ReGlu是一种GLU变体,使用Relu作为激活函数 |
| sigmoid | 本样例演示了基于Sigmoid高阶API实现的算子实现。样例按元素做逻辑回归Sigmoid |
| silu | 本样例演示了基于Silu高阶API的算子实现。样例按元素做Silu运算 |
| simplesoftmax | 本样例介绍了调用SimpleSoftMax高阶API实现softmax单算子,使用计算好的sum和max数据对输入tensor做Softmax计算 |
| softmax | 本样例介绍了调用SoftMax高阶API实现softmax单算子,将输入tensor[m0, m1, ...mt, n](t大于等于0)的非尾轴长度相乘的结果看作m,则输入tensor的shape看作[m, n] |
| softmaxflashv2 | 本样例介绍了调用SoftmaxFlashV2高阶api实现softmaxflashv2单算子,SoftmaxFlash增强版本,对应FlashAttention-2算法 |
| softmaxflashv3 | 本样例介绍了调用SoftmaxFlashV3高阶api实现softmaxflashv3单算子,SoftmaxFlash增强版本,对应Softmax PASA算法 |
| softmaxgrad | 本样例介绍了调用SoftmaxGrad高阶API实现softmaxgrad单算子,将输入tensor[m0, m1, ...mt, n](t大于等于0)的非尾轴长度相乘的结果看作m,则输入tensor的shape看作[m, n] |
| softmaxgradfront | 本样例介绍了调用SoftmaxGradFront高阶API实现softmaxgradfront单算子,将输入tensor[m0, m1, ...mt, n](t大于等于0)的非尾轴长度相乘的结果看作m,则输入tensor的shape看作[m, n] |
| swiglu | 本样例演示了基于SwiGLU高阶API实现的算子实现。样例采用Swish作为激活函数的GLU变体 |
| swish | 本样例演示了基于Swish高阶API的算子实现。在神经网络中,Swish是一个重要的激活函数 |