asc_set_atomic_max
产品支持情况
| 产品 | 是否支持 |
|---|---|
| Ascend 950PR/Ascend 950DT | √ |
| Atlas A3 训练系列产品/Atlas A3 推理系列产品 | √ |
| Atlas A2 训练系列产品/Atlas A2 推理系列产品 | √ |
功能说明
设置计算结果以原子比较的方式传输到GM。在拷贝前,将待传输的数据与GM中已有数据进行逐元素比较,并将最大值写入GM。数据类型支持int8_t/int16_t/int32_t/bfloat16_t/half/float。
函数原型
__aicore__ inline void asc_set_atomic_max_int8()
__aicore__ inline void asc_set_atomic_max_int16()
__aicore__ inline void asc_set_atomic_max_int()
__aicore__ inline void asc_set_atomic_max_bfloat()
__aicore__ inline void asc_set_atomic_max_float16()
__aicore__ inline void asc_set_atomic_max_float()
参数说明
无
返回值说明
无
流水类型
PIPE_S
约束说明
使用结束后,建议通过asc_set_atomic_none关闭原子最大操作,以免影响后续相关指令功能。
调用示例
// total_length指参与计算的数据长度,dst是外部输入的float类型的GM内存。
constexpr uint32_t total_length = 256;
__ubuf__ int8_t src0[total_length];
__ubuf__ int8_t src1[total_length];
asc_copy_ub2gm(dst, src0, total_length * sizeof(int8_t));
asc_sync_pipe(PIPE_MTE3);
asc_set_atomic_max_int8();
asc_copy_ub2gm(dst, src1, total_length * sizeof(int8_t));
asc_set_atomic_none();
结果示例:
输入数据src0:[1, 1, 1, ..., 1] // int8_t类型
输入数据src1:[2, 2, 2, ..., 2] // int8_t类型
输出数据dst:[2, 2, 2, ..., 2] // int8_t类型