asc_set_atomic_min

产品支持情况

产品 是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

设置对后续的从Unified Buffer/L0C Buffer/L1 Buffer到Global Memory的数据传输开启原子比较取小操作。数据类型支持int8_t、int16_t、int32_t、bfloat16_t、half、float。

特别地,针对Ascend 950PR/Ascend 950DT,不支持L1 Buffer到Global Memory的通路。

函数原型

__aicore__ inline void asc_set_atomic_min_int8()
__aicore__ inline void asc_set_atomic_min_int16()
__aicore__ inline void asc_set_atomic_min_bfloat()
__aicore__ inline void asc_set_atomic_min_float16()
__aicore__ inline void asc_set_atomic_min_int()
__aicore__ inline void asc_set_atomic_min_float()

参数说明

返回值说明

流水类型

PIPE_S

约束说明

  • 使用结束后,建议通过asc_set_atomic_none关闭原子最小操作,以免影响后续相关指令功能。
  • 针对Ascend 950PR/Ascend 950DT,不支持L1 Buffer到Global Memory的通路。

调用示例

// total_length指参与计算的数据长度,dst是外部输入的float类型的GM内存。
constexpr uint32_t total_length = 256;
__ubuf__ int8_t src0[total_length];
__ubuf__ int8_t src1[total_length];
asc_copy_ub2gm(dst, src0, total_length * sizeof(int8_t));
asc_sync_pipe(PIPE_MTE3);
asc_set_atomic_min_int8();
asc_copy_ub2gm(dst, src1, total_length * sizeof(int8_t));
asc_set_atomic_none();

结果示例:

输入数据src0:[1, 1, 1, ..., 1]  // int8_t类型
输入数据src1:[2, 2, 2, ..., 2]  // int8_t类型
输出数据dst:[1, 1, 1, ..., 1]   // int8_t类型