num_threads
产品支持情况
- Ascend 950PR/Ascend 950DT:支持
- Atlas A3 训练系列产品/Atlas A3 推理系列产品:不支持
- Atlas A2 训练系列产品/Atlas A2 推理系列产品:不支持
- Atlas 200I/500 A2 推理产品:不支持
- Atlas 推理系列产品AI Core:不支持
- Atlas 推理系列产品Vector Core:不支持
- Atlas 训练系列产品:不支持
功能说明
获取coalesced_group组内线程总数。
函数原型
unsigned long long num_threads() const
参数说明
无
返回值说明
coalesced_group组内线程总数。
约束说明
无
调用示例
示例代码中偶数id的线程使用coalesced_group进行协同,奇数线程独立执行业务,一个Warp中共有16个偶数id的线程。
-
SIMT编程场景:
using namespace cooperative_groups; __global__ void simt_kernel(...) { ... if (threadIdx.x % 2 == 0) { coalesced_group active = coalesced_threads(); unsigned long long thread_num = active.num_threads(); // 返回16 } ... } -
SIMD与SIMT混合编程场景:
using namespace cooperative_groups; __simt_vf__ inline void simt_kernel(...) { ... if (threadIdx.x % 2 == 0) { coalesced_group active = coalesced_threads(); unsigned long long thread_num = active.num_threads(); // 返回16 } ... }