AllocTensor(FlowBufferFactory类)

产品支持情况

产品 是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品

函数功能

为了减少输入输出的拷贝耗时,提供了构建使用共享内存的类型的类FlowBufferFactory 。

AllocTensor根据shape、data type和对齐大小申请Tensor,默认申请以64字节对齐,可以指定对齐大小,方便性能调优。

函数原型

std::shared_ptr<Tensor> AllocTensor(const std::vector<int64_t> &shape, TensorDataType dataType, uint32_t align = 512U)

参数说明

参数名 输入/输出 描述
shape 输入 Tensor的shape。
dataType 输入 Tensor的dataType。
align 输入 申请内存地址对齐大小,取值范围【32、64、128、256、512、1024】。

返回值

申请的Tensor指针。

异常处理

申请不到Tensor指针则返回NULL。

约束说明

无。