LogicalOrs
产品支持情况
功能说明
输入矢量内的每个元素与标量进行或操作。当输入矢量、标量的数据类型不是bool时,零被视为False,非零数据被视为True。接口中矢量与标量的顺序支持标量在前和标量在后两种场景,其中,标量支持配置为LocalTensor的单点元素。计算公式如下,idx表示LocalTensor单点元素的位置系数:

函数原型
template <const LogicalOrsConfig& config = DEFAULT_LOGICAL_ORS_CONFIG, typename T, typename U, typename S>
__aicore__ inline void LogicalOrs(const LocalTensor<T>& dst, const U& src0, const S& src1, const uint32_t count)
参数说明
表 1 模板参数说明
struct LogicalOrsConfig {
bool isReuseSource;
int8_t scalarTensorIndex;
};
表 2 接口参数说明
|
类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。 |
||
源操作数。类型为标量或LocalTensor,类型为LocalTensor时,可以为矢量操作数或标量单点元素,支持的TPosition为VECIN/VECCALC/VECOUT。 |
||
返回值说明
无
约束说明
-
本接口或操作的左操作数及右操作数中必须有一个为矢量,当前不支持左右操作数同时为标量。
-
当传入LocalTensor的单点数据作为标量时,scalarTensorIndex参数需要传入编译期已知的常量,如果传入变量,则需要将该变量声明为constexpr。
-
不支持源操作数与目的操作数地址重叠。
-
操作数地址对齐要求请参见通用地址对齐约束。
调用示例
AscendC::LocalTensor<bool> dst;
AscendC::LocalTensor<half> src0, src1;
uint32_t count = 512;
// 标量在后
AscendC::LogicalOrs(dst, src0, src1, count);
// 标量在前
static constexpr AscendC::LogicalOrsConfig config= { false, 0 };
AscendC::LogicalOrs<config>(dst, src0, src1, count);
结果示例如下:
// 标量在后
输入数据(src0):
[0.4646, 0.2520, 0.3884, 0.0000, 0.2904, 0.0000, 0.5690, 0.2191, 0.7354,
0.0000, 0.8093, 0.5932, 0.2688, 0.0830, 0.5074, 0.5595, 0.1468, 0.7020,
... 0.0238]
输入数据(src1):
[0.0000]
输出数据(dst):
[ True, True, True, False, True, False, True, True, True, False,
True, True, True, True, True, True, True, True, ... True]
// 标量在前
输入数据(src1):
[0.4646, 0.2520, 0.3884, 0.0000, 0.2904, 0.0000, 0.5690, 0.2191, 0.7354,
0.0000, 0.8093, 0.5932, 0.2688, 0.0830, 0.5074, 0.5595, 0.1468, 0.7020,
... 0.0238]
输入数据(src0):
[0.0000]
输出数据(dst):
[ True, True, True, False, True, False, True, True, True, False,
True, True, True, True, True, True, True, True, ... True]