FusedExpSub(ISASI)
产品支持情况
功能说明
src0与src1相减,将差值作为指数计算自然常数e的幂次, 并将计算结果写入dst。
源操作数数据类型为float类型时,计算公式如下:

源操作数数据类型为half类型时,计算公式如下:
针对Ascend 950PR/Ascend 950DT:

函数原型
template <typename T, typename U>
__aicore__ inline void FusedExpSub(const LocalTensor<T>& dst, const LocalTensor<U>& src0, const LocalTensor<U>& src1, const uint32_t count)
参数说明
表 1 模板参数说明
表 2 参数说明
|
类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。 |
||
|
类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。 |
||
返回值说明
无
约束说明
- 操作数地址对齐要求请参见通用地址对齐约束。
调用示例
AscendC::FusedExpSub(dstLocal, src0Local, src1Local, 512);
结果示例如下:
输入数据src0Local:[1 2 4 ... 510]
输入数据src1Local:[1 1 2 ... 510]
输出数据dstLocal:[1 2.71828 7.38905 ... 1]