npu_max_pool2d
接口原型
mx_driving.npu_max_pool2d(Tensor x, int kernel_size, int stride, int padding) -> Tensor
功能描述
对输入进行最大池化,并输出最大池化值。
参数说明
x (Tensor):一组待池化对象,数据类型为float32,format为NCHW,输入数据量不超过10亿。kernel_size (int):池化核大小,当前仅支持3。stride (int):池化核在输入数据上滑动时的步长,当前仅支持2。padding (int):填充值,当前仅支持1。
返回值
y (Tensor):池化后的最大值,数据类型为float32,format为NCHW。
约束说明
1、kernel_size仅支持3,stride仅支持2,padding仅支持1,且输入C轴数据量要求为8的倍数,H和W需要大于100。 2、支持C<=1024,性能在C值较大的场景下较优,建议使用规格为C>=64。
支持的型号
- Atlas A2 训练系列产品
调用示例
import torch, torch_npu
from mx_driving import npu_max_pool2d
kernel_size = 3
stride = 2
padding = 1
x = torch.randn(18, 64, 464, 800).npu()
res = npu_max_pool2d(x, kernel_size, stride, padding)