num_threads

产品支持情况

  • Ascend 950PR/Ascend 950DT:支持
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:不支持
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品:不支持
  • Atlas 200I/500 A2 推理产品:不支持
  • Atlas 推理系列产品AI Core:不支持
  • Atlas 推理系列产品Vector Core:不支持
  • Atlas 训练系列产品:不支持

功能说明

获取coalesced_group组内线程总数。

函数原型

unsigned long long num_threads() const

参数说明

返回值说明

coalesced_group组内线程总数。

约束说明

调用示例

示例代码中偶数id的线程使用coalesced_group进行协同,奇数线程独立执行业务,一个Warp中共有16个偶数id的线程。

  • SIMT编程场景:

    using namespace cooperative_groups;
    __global__ void simt_kernel(...)
    {
        ...
        if (threadIdx.x % 2 == 0) {
            coalesced_group active = coalesced_threads();
            unsigned long long thread_num = active.num_threads(); // 返回16
        }
        ...
    }
    
  • SIMD与SIMT混合编程场景:

    using namespace cooperative_groups;
    __simt_vf__ inline void simt_kernel(...)
    {
        ...
        if (threadIdx.x % 2 == 0) {
            coalesced_group active = coalesced_threads();
            unsigned long long thread_num = active.num_threads(); // 返回16
        }
        ...
    }