lanemask_lt

产品支持情况

  • Ascend 950PR/Ascend 950DT:支持
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:不支持
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品:不支持
  • Atlas 200I/500 A2 推理产品:不支持
  • Atlas 推理系列产品AI Core:不支持
  • Atlas 推理系列产品Vector Core:不支持
  • Atlas 训练系列产品:不支持

功能说明

获取当前线程的一个32位掩码,在当前线程所属的Warp中,将“laneid严格小于当前线程”的线程的对应位设为1,其余位为0。

如laneid为0的线程,调用本接口获取到32位掩码:0000 0000 0000 0000 0000 0000 0000 0000。

如laneid为31的线程,调用本接口获取到32位掩码:0111 1111 1111 1111 1111 1111 1111 1111。

图 1 lanemask_lt示意图

函数原型

int32_t lanemask_lt()

参数说明

返回值说明

返回一个32位整数的位掩码。

约束说明

需要包含的头文件

使用该接口需要包含"simt_api/device_functions.h"头文件。

#include "simt_api/device_functions.h" 

调用示例

  • SIMT编程场景:

    __global__ __launch_bounds__(1024) void kernel_lanemask_lt(int32_t* dst)
    {
        int idx = threadIdx.x + blockIdx.x * blockDim.x;
        int32_t lanemask = lanemask_lt();
        dst[idx] = lanemask;
    }
    
  • SIMD与SIMT混合编程场景:

    __simt_vf__ __launch_bounds__(1024) void kernel_lanemask_lt(__gm__ int32_t* dst)
    {
        int idx = threadIdx.x + blockIdx.x * blockDim.x;
        int32_t lanemask = lanemask_lt();
        dst[idx] = lanemask;
    }