asc_set_atomic_min
产品支持情况
| 产品 | 是否支持 |
|---|---|
| Ascend 950PR/Ascend 950DT | √ |
| Atlas A3 训练系列产品/Atlas A3 推理系列产品 | √ |
| Atlas A2 训练系列产品/Atlas A2 推理系列产品 | √ |
功能说明
设置对后续的从Unified Buffer/L0C Buffer/L1 Buffer到Global Memory的数据传输开启原子比较取小操作。数据类型支持int8_t、int16_t、int32_t、bfloat16_t、half、float。
特别地,针对Ascend 950PR/Ascend 950DT,不支持L1 Buffer到Global Memory的通路。
函数原型
__aicore__ inline void asc_set_atomic_min_int8()
__aicore__ inline void asc_set_atomic_min_int16()
__aicore__ inline void asc_set_atomic_min_bfloat()
__aicore__ inline void asc_set_atomic_min_float16()
__aicore__ inline void asc_set_atomic_min_int()
__aicore__ inline void asc_set_atomic_min_float()
参数说明
无
返回值说明
无
流水类型
PIPE_S
约束说明
- 使用结束后,建议通过asc_set_atomic_none关闭原子最小操作,以免影响后续相关指令功能。
- 针对Ascend 950PR/Ascend 950DT,不支持L1 Buffer到Global Memory的通路。
调用示例
// total_length指参与计算的数据长度,dst是外部输入的float类型的GM内存。
constexpr uint32_t total_length = 256;
__ubuf__ int8_t src0[total_length];
__ubuf__ int8_t src1[total_length];
asc_copy_ub2gm(dst, src0, total_length * sizeof(int8_t));
asc_sync_pipe(PIPE_MTE3);
asc_set_atomic_min_int8();
asc_copy_ub2gm(dst, src1, total_length * sizeof(int8_t));
asc_set_atomic_none();
结果示例:
输入数据src0:[1, 1, 1, ..., 1] // int8_t类型
输入数据src1:[2, 2, 2, ..., 2] // int8_t类型
输出数据dst:[1, 1, 1, ..., 1] // int8_t类型