DataCachePreload

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品/Atlas A3 推理系列产品

Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

从源地址所在的特定GM地址预加载数据到data cache中。

函数原型

template <typename T>
__aicore__ inline void DataCachePreload(const GlobalTensor<uint64_t>& src, const T cacheOffset)

参数说明

表 1 参数说明

参数名

输入/输出

描述

src

输入

源操作数,类型为GlobalTensor。支持的数据类型为:uint64_t。

cacheOffset

输入

在源操作数上偏移cacheOffset大小开始加载数据,单位为byte,支持的数据类型为:int16_t/int64_t。

返回值说明

约束说明

频繁调用此接口可能导致保留站拥塞,这种情况下,此指令将被视为NOP指令,阻塞Scalar流水。因此不建议频繁调用该接口。

调用示例

AscendC::GlobalTensor<uint64_t> srcGlobal;
int64_t cacheOffset = 0;
AscendC::DataCachePreload(srcGlobal, cacheOffset);