DataCachePreload

产品支持情况

产品 是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品
Atlas 推理系列产品AI Core
Atlas 推理系列产品Vector Core x
Atlas 训练系列产品 x

功能说明

头文件路径为:"basic_api/kernel_operator_cache_intf.h"

从源地址所在的特定GM地址预加载数据到DCache中,每次调用只能预加载一个Cache Line大小的数据。

函数原型

template <typename T>
__aicore__ inline void DataCachePreload(const GlobalTensor<uint64_t>& src, const T cacheOffset)

参数说明

表 1 参数说明

参数名 输入/输出 描述
src 输入 源操作数,类型为GlobalTensor。支持的数据类型为:uint64_t。
cacheOffset 输入 在源操作数上偏移cacheOffset大小开始加载数据,单位为byte,支持的数据类型为:int16_t/int64_t。

返回值说明

约束说明

频繁调用此接口可能导致保留站(Reservation Station,用于暂存待执行指令的硬件队列)发生拥塞。在此情况下,该指令将被视为NOP指令,进而阻塞Scalar流水线。因此,建议连续调用此接口的次数不要超过4次。

调用示例

AscendC::GlobalTensor<uint64_t> srcGlobal;
int64_t cacheOffset = 0;
AscendC::DataCachePreload(srcGlobal, cacheOffset);