asc_set_atomic_max

产品支持情况

产品 是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

设置计算结果以原子比较的方式传输到GM。在拷贝前,将待传输的数据与GM中已有数据进行逐元素比较,并将最大值写入GM。数据类型支持int8_t/int16_t/int32_t/bfloat16_t/half/float。

函数原型

__aicore__ inline void asc_set_atomic_max_int8()
__aicore__ inline void asc_set_atomic_max_int16()
__aicore__ inline void asc_set_atomic_max_int()
__aicore__ inline void asc_set_atomic_max_bfloat()
__aicore__ inline void asc_set_atomic_max_float16()
__aicore__ inline void asc_set_atomic_max_float()

参数说明

返回值说明

流水类型

PIPE_S

约束说明

使用结束后,建议通过asc_set_atomic_none关闭原子最大操作,以免影响后续相关指令功能。

调用示例

// total_length指参与计算的数据长度,dst是外部输入的float类型的GM内存。
constexpr uint32_t total_length = 256;
__ubuf__ int8_t src0[total_length];
__ubuf__ int8_t src1[total_length];
asc_copy_ub2gm(dst, src0, total_length * sizeof(int8_t));
asc_sync_pipe(PIPE_MTE3);
asc_set_atomic_max_int8();
asc_copy_ub2gm(dst, src1, total_length * sizeof(int8_t));
asc_set_atomic_none();

结果示例:

输入数据src0:[1, 1, 1, ..., 1]  // int8_t类型
输入数据src1:[2, 2, 2, ..., 2]  // int8_t类型
输出数据dst:[2, 2, 2, ..., 2]   // int8_t类型