SetAtomicAdd

产品 是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品
Atlas 推理系列产品AI Core
Atlas 推理系列产品Vector Core x
Atlas 训练系列产品

功能说明

头文件路径为:"basic_api/kernel_operator_set_atomic_intf.h"

对后续目的地址为GM的数据搬运开启原子累加。原子累加过程:将待拷贝的内容和GM已有内容进行求和,然后将求和结果写入GM。SetAtomicAdd接口可通过模板参数设定不同的累加数据类型。

函数原型

template <typename T>
__aicore__ inline void SetAtomicAdd()

参数说明

表 1 模板参数说明

参数名 描述
T 设定不同的原子累加操作数据类型。

数据类型

  • Ascend 950PR/Ascend 950DT,支持的数据类型为int8_t、int16_t、half、bfloat16_t、int32_t、float。
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品,支持的数据类型为int8_t、int16_t、half、bfloat16_t、int32_t、float。
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品,支持的数据类型为int8_t、int16_t、half、bfloat16_t、int32_t、float。
  • Atlas 200I/500 A2 推理产品,支持的数据类型为int16_t、half、int32_t、float。
  • Atlas 推理系列产品AI Core,支持的数据类型为int16_t、half、float。
  • Atlas 训练系列产品,支持的数据类型为float。

返回值说明

约束说明

  • Ascend 950PR/Ascend 950DT,支持的数据通路为UB/L0C Buffer->GM。
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品,支持的数据通路为UB/L0C Buffer/L1 Buffer->GM。
  • Atlas A2 训练系列产品/Atlas A2 推理系列产品,支持的数据通路为UB/L0C Buffer/L1 Buffer->GM。
  • Atlas 200I/500 A2 推理产品,支持的数据通路为UB/L0C Buffer/L1 Buffer->GM。
  • Atlas 推理系列产品AI Core,支持的数据通路为UB->GM。
  • Atlas 训练系列产品,支持的数据通路为UB->GM。
  • 累加操作完成后,建议通过DisableDmaAtomic关闭原子累加,以免影响后续相关指令功能。
  • 该接口执行前不会自动清零GM数据。开发者需根据算子逻辑判断是否清零,如需清零,请在执行前手动完成。
  • SetAtomicAdd内部已集成与SetAtomicType相同的功能。建议调用上述接口时,通过设置模板参数显式指定原子操作的数据类型,无需额外调用SetAtomicType接口。

调用示例

AscendC::LocalMemAllocator<AscendC::Hardware::UB> ubAllocator;
AscendC::LocalTensor<T> srcLocal = ubAllocator.Alloc<T, SIZE>();

AscendC::DisableDmaAtomic();
AscendC::DataCopy(srcLocal, srcGlobal, SIZE);
AscendC::SetFlag<AscendC::HardEvent::MTE2_MTE3>(EVENT_ID0);
AscendC::WaitFlag<AscendC::HardEvent::MTE2_MTE3>(EVENT_ID0);
AscendC::SyncAll();

// 开启原子累加,将UB数据原子累加到GM
AscendC::SetAtomicAdd<T>();
AscendC::DataCopy(dstGlobal, srcLocal, SIZE);

// 关闭原子累加
AscendC::DisableDmaAtomic();

完整样例请参考DataMovementWithAtomicOperations样例