ReinterpretCast

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品/Atlas A3 推理系列产品

x

Atlas A2 训练系列产品/Atlas A2 推理系列产品

x

功能说明

将当前GlobalTensor重解释为用户指定的新类型。转换后的Tensor与原Tensor地址及内容完全相同,Tensor的内存大小(比特数)保持不变。

函数原型

template <typename CAST_T>
__aicore__ inline GlobalTensor<CAST_T> ReinterpretCast() const

参数说明

表 1 模板参数说明

参数名

描述

CAST_T

指定重解释后的新类型。

返回值说明

重解释后的GlobalTensor。

约束说明

当数据类型发生转换后,元素个数可能无法取整,例如3个int4b_t类型转换为uint32_t,则转换后调用GetSize接口,只能获取向下取整的整数值,这种场景在CPU状态运行时,会有对应的提示告警信息。

调用示例

void Init(__gm__ uint8_t *src_gm, __gm__ uint8_t *dst_gm)
{
    uint64_t dataSize = 256; //设置input_global的大小为256

    AscendC::GlobalTensor<int32_t> inputGlobal; // 类型为int32_t
    inputGlobal.SetGlobalBuffer(reinterpret_cast<__gm__ int32_t *>(src_gm), dataSize); // 设置源操作数在Global Memory上的起始地址为src_gm,所占外部存储的大小为256个int32_t

    AscendC::LocalTensor<int32_t> inputLocal = inQueueX.AllocTensor<int32_t>();    
    AscendC::DataCopy(inputLocal, inputGlobal, dataSize); // 将Global Memory上的inputGlobal拷贝到Local Memory的inputLocal上
    ...
    // 假设inputGlobal为int32_t 类型,包含16个元素(64字节)
    // 调用ReinterpretCast将inputGlobal重解释为int16_t类型
    AscendC::GlobalTensor<int16_t> interpreTensor = inputGlobal.template ReinterpretCast<int16_t>();
    // 示例结果如下,二者数据完全一致,在物理内存上也是同一地址,仅根据不同类型进行了重解释
    // inputGlobal:0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
    // interpreTensor:0 0 1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 10 0 11 0 12 0 13 0 14 0 15 0

}