Im2col

产品支持情况

产品 是否支持
Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
Atlas 200I/500 A2 推理产品 ×
Atlas 推理系列产品 ×
Atlas 训练系列产品 ×

功能说明

  • 算子功能:图像到列,滑动局部窗口数据转为列向量,拼接为大张量。从批处理输入张量中提取滑动窗口。考虑一个形状为(N, C, H, W)或 (C, H, W) 的批处理input张量,其中N是批处理维度, C是通道维度, 而 H, W 表示图像大小,此操作将input的空间维度内的每个滑动kernel_size大小的块展平为(N, C ×∏\times \prod(kernel_size), L)的3-D 或 (C ×∏\times \prod(kernel_size), L)的2-D 的 output张量的列(即最后一维),而L是这些块的总数。
  • 计算公式: L=∏d⌊spatial_size[d]+2×padding[d]−dilation[d]×(kernel_size[d]−1)−1stride[d]+1⌋L = \prod_{d} \lfloor \frac{spatial\_size[d] + 2 \times padding[d] - dilation[d] \times (kernel\_size[d] -1) -1}{stride[d]} + 1 \rfloor, 其中spatial_size由上述input张量的H,W构成。

参数说明

参数名 输入/输出/属性 描述 数据类型 数据格式
self 输入张量 输入张量,shape为3维或4维。 INT8、UINT8、INT16、UINT16、INT32、UINT32、INT64、UINT64、BFLOAT16、FLOAT16、FLOAT、DOUBLE、BOOL、COMPLEX32、COMPLEX64 ND
kernelSize 输入数组 卷积核的大小,size为2,kernelSize[0]表示'H'方向,kernelSize[1]表示'W'方向。 INT64 -
dilation 输入数组 膨胀参数,size为2,dilation[0]表示'H'方向,dilation[1]表示'W'方向。 INT64 -
padding 输入数组 填充大小,size为2,padding[0]表示H方向,padding[1]表示W方向。 INT64 -
stride 输入数组 步长,size为2,stride[0]表示H方向,stride[1]表示W方向。 INT64 -
out 输出张量 输出张量,shape根据参数推导得出。 INT8、UINT8、INT16、UINT16、INT32、UINT32、INT64、UINT64、BFLOAT16、FLOAT16、FLOAT、DOUBLE、BOOL、COMPLEX32、COMPLEX64 ND
  • Atlas A3 训练系列产品/Atlas A3 推理系列产品、Atlas A2 训练系列产品/Atlas A2 推理系列产品:仅支持FLOAT、FLOAT16、BFLOAT16。

约束说明

  • 输入张量的维度必须是3维或4维。
  • kernelSize、dilation、padding、stride的size必须为2。
  • kernelSize、dilation、stride的值必须大于0。
  • padding的值不能小于0。

调用说明

调用方式 样例代码 说明
aclnn调用 test_aclnn_im2col 通过aclnnIm2col接口方式调用Im2col算子。
图模式调用 test_geir_im2col 通过算子IR构图方式调用Im2col算子。