LogicalOrs

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品/Atlas A3 推理系列产品

x

Atlas A2 训练系列产品/Atlas A2 推理系列产品

x

功能说明

输入矢量内的每个元素与标量进行或操作。当输入矢量、标量的数据类型不是bool时,零被视为False,非零数据被视为True。接口中矢量与标量的顺序支持标量在前和标量在后两种场景,其中,标量支持配置为LocalTensor的单点元素。计算公式如下,idx表示LocalTensor单点元素的位置系数:

函数原型

template <const LogicalOrsConfig& config = DEFAULT_LOGICAL_ORS_CONFIG, typename T, typename U, typename S>
__aicore__ inline void LogicalOrs(const LocalTensor<T>& dst, const U& src0, const S& src1, const uint32_t count)

参数说明

表 1 模板参数说明

参数名

描述

config

LogicalOrs算法的相关配置。此参数可选配,LogicalOrsConfig类型,具体定义如下方代码所示,其中参数的含义为:

isReuseSource:该参数预留,传入默认值false即可。

scalarTensorIndex:当标量为LocalTensor的单点元素时,该参数用于指定标量作为或操作中的左操作数或右操作数,0表示左操作数,1(默认值)表示右操作数。

T

目的操作数的数据类型。

Ascend 950PR/Ascend 950DT,支持的数据类型为:bool。

U

LocalTensor类型或标量类型。根据输入参数src0自动推导类型,开发者无需配置该参数,保证src0满足数据类型的约束即可。

Ascend 950PR/Ascend 950DT,支持的数据类型为:bool、int8_t、uint8_t、int16_t、uint16_t、half、bfloat16_t、int32_t、uint32_t、float、int64_t、uint64_t。

S

LocalTensor类型或标量类型。根据输入参数src1自动推导类型,开发者无需配置该参数,保证src1满足数据类型的约束即可。

Ascend 950PR/Ascend 950DT,支持的数据类型为:bool、int8_t、uint8_t、int16_t、uint16_t、half、bfloat16_t、int32_t、uint32_t、float、int64_t、uint64_t。

struct LogicalOrsConfig {
    bool isReuseSource;
    int8_t scalarTensorIndex;
};

表 2 接口参数说明

参数名

输入/输出

描述

dst

输出

目的操作数。

类型为LocalTensor,支持的TPosition为VECIN/VECCALC/VECOUT。

src0、src1

输入

源操作数。类型为标量或LocalTensor,类型为LocalTensor时,可以为矢量操作数或标量单点元素,支持的TPosition为VECIN/VECCALC/VECOUT。

count

输入

参与计算的元素个数。

返回值说明

约束说明

  • 本接口或操作的左操作数及右操作数中必须有一个为矢量,当前不支持左右操作数同时为标量。

  • 当传入LocalTensor的单点数据作为标量时,scalarTensorIndex参数需要传入编译期已知的常量,如果传入变量,则需要将该变量声明为constexpr。

  • 不支持源操作数与目的操作数地址重叠。

  • 操作数地址对齐要求请参见通用地址对齐约束

调用示例

AscendC::LocalTensor<bool> dst;
AscendC::LocalTensor<half> src0, src1;
uint32_t count = 512;
// 标量在后
AscendC::LogicalOrs(dst, src0, src1, count); 
// 标量在前
static constexpr AscendC::LogicalOrsConfig config= { false, 0 };
AscendC::LogicalOrs<config>(dst, src0, src1, count); 

结果示例如下:

// 标量在后
输入数据(src0): 
[0.4646, 0.2520, 0.3884, 0.0000, 0.2904, 0.0000, 0.5690, 0.2191, 0.7354,
 0.0000, 0.8093, 0.5932, 0.2688, 0.0830, 0.5074, 0.5595, 0.1468, 0.7020,
 ... 0.0238]
输入数据(src1): 
[0.0000]
输出数据(dst): 
[ True,  True,  True,  False,  True,  False,  True,  True,  True,  False,
  True,  True,  True,  True,  True,  True,  True,  True,  ...  True]
// 标量在前
输入数据(src1): 
[0.4646, 0.2520, 0.3884, 0.0000, 0.2904, 0.0000, 0.5690, 0.2191, 0.7354,
 0.0000, 0.8093, 0.5932, 0.2688, 0.0830, 0.5074, 0.5595, 0.1468, 0.7020,
 ... 0.0238]
输入数据(src0): 
[0.0000]
输出数据(dst): 
[ True,  True,  True,  False,  True,  False,  True,  True,  True,  False,
  True,  True,  True,  True,  True,  True,  True,  True,  ...  True]