npu_max_pool2d

接口原型

mx_driving.npu_max_pool2d(Tensor x, int kernel_size, int stride, int padding) -> Tensor

功能描述

对输入进行最大池化,并输出最大池化值。

参数说明

  • x (Tensor):一组待池化对象,数据类型为float32,format为NCHW,输入数据量不超过10亿。
  • kernel_size (int):池化核大小,当前仅支持3。
  • stride (int):池化核在输入数据上滑动时的步长,当前仅支持2。
  • padding (int):填充值,当前仅支持1。

返回值

  • y (Tensor):池化后的最大值,数据类型为float32,format为NCHW。

约束说明

1、kernel_size仅支持3,stride仅支持2,padding仅支持1,且输入C轴数据量要求为8的倍数,H和W需要大于100。 2、支持C<=1024,性能在C值较大的场景下较优,建议使用规格为C>=64。

支持的型号

  • Atlas A2 训练系列产品

调用示例

import torch, torch_npu
from mx_driving import npu_max_pool2d
kernel_size = 3
stride = 2
padding = 1
x = torch.randn(18, 64, 464, 800).npu()
res = npu_max_pool2d(x, kernel_size, stride, padding)