Star693

Star693

cann-robotconv2dv2 ops hi <= 2 should not use baiscBlock && uint underflow protection

a9a00c4c创建于 3月14日历史提交

文件	最后提交记录	最后更新时间
examples	conv算子代码同步	4 个月前
op_graph	ops-nn-dev 迁移 ops-nn	5 个月前
op_host	conv2dv2 ops hi <= 2 should not use baiscBlock && uint underflow protection	2 个月前
op_kernel	conv2dv2 ops hi <= 2 should not use baiscBlock && uint underflow protection	2 个月前
tests	conv2dv2 ops hi <= 2 should not use baiscBlock && uint underflow protection	2 个月前
CMakeLists.txt	ops-nn-dev 迁移 ops-nn	5 个月前
README.md	conv相关doc补充修改	4 个月前

Conv2DV2

产品支持情况

产品	是否支持
Ascend 950PR/Ascend 950DT	√
Atlas A3 训练系列产品/Atlas A3 推理系列产品	×
Atlas A2 训练系列产品/Atlas A2 推理系列产品	×

功能说明

算子功能：实现 2D 卷积功能。
计算公式：
- 假定输入（x）的 shape 是 $C_{\text{in}}, H, W)$ ，（filter）的 shape 是 $(Cout,Cin,Kh,Kw)(C_{\text{out}}, C_{\text{in}}, K_h, K_w)$ ，输出（y）的 shape 是 $C_{\text{out}}, H_{\text{out}}, W_{\text{out}})$
- 输出表示为：
$\text{out}(N_i, C_{\text{out}_j}) = \text{bias}(C_{\text{out}_j}) + \sum_{k = 0}^{C_{\text{in}} - 1} \text{filter}(C_{\text{out}_j}, k) \star \text{x}(N_i, k)$

其中， $⋆\star$ 表示卷积计算，支持空洞卷积、分组卷积。 $N$ 代表 batch size， $C$ 代表通道数， $H$ 和 $W$ 分别代表高和宽，相应输出维度的计算公式如下：

$Hout=(H+pad_top+pad_bottom−(dilation_h×(Kh−1)+1))/stride_h+1Wout=(W+pad_left+pad_right−(dilation_w×(Kw−1)+1))/stride_w+1 H_{\text{out}} = (H + \text{pad\_top} + \text{pad\_bottom} - (\text{dilation\_h} \times (K_h - 1) + 1)) / \text{stride\_h} + 1 \\ W_{\text{out}} = (W + \text{pad\_left} + \text{pad\_right} - (\text{dilation\_w} \times (K_w - 1) + 1)) / \text{stride\_w} + 1$

参数说明

参数名	输入 / 输出 / 属性	描述	数据类型	数据格式
x	输入	公式中的输入张量 x。	FLOAT16、FLOAT、BFLOAT16、HIFLOAT8	NCHW、NHWC
filter	输入	公式中的卷积权重张量 filter。	FLOAT16、FLOAT、BFLOAT16、HIFLOAT8	NCHW、HWCN
bias	可选输入	卷积偏置张量 bias。	FLOAT16、FLOAT、BFLOAT16	ND
offset_w	可选输入	量化偏移张量 offset_w（未使用）。	INT8	-
y	输出	公式中的输出张量 y。	FLOAT16、FLOAT、BFLOAT16、HIFLOAT8	NCDHW、NDHWC
strides	属性	卷积扫描步长，stride_h, stride_w ∈ [1,63]。	INT32	-
pads	可选属性	对输入的填充，pad_h, pad_w ∈ [0,255]。	INT32	-
dilations	可选属性	卷积核中元素的间隔，dilation_h, dilation_w ∈ [1,255]。	INT32	-
groups	可选属性	从输入通道到输出通道的块链接个数，必须满足 groups × filter 的 in_channels 维度 = x 的 in_channels 维度。支持范围 [1, 65535]。	INT32	-
data_format	可选属性	输入数据格式，支持 "NCHW"、"NHWC"。	STRING	-
offset_x	可选属性	量化算法中的偏移 offset_x（未使用）。	INT32	-
pad_mode	可选属性	填充模式，支持 "SPECIFIC"、"SAME"、"VALID"、"SAME_UPPER", "SAME_LOWER"。	STRING	-
enable_hf32	可选属性	是否启用 HF32 计算，支持 true、false。	BOOL	-

约束说明

Ascend 950PR/Ascend 950DT：

当 x 数据类型为 HIFLOAT8 时，filter 的数据类型必须与 x 一致。N 维度大小应该大于等于 0。H、W 维度大小应该大于等于 0（等于 0 的场景仅在输出 y 的 H、W 维度也等于 0 时支持）。C 维度大小应该大于等于 0（等于 0 的场景仅在输出 y 的任意维度也等于 0 时支持）。
对于 filter 输入，H、W 的大小应该在 [1, 511] 的范围内。N 维度大小应该大于等于 0（等于 0 的场景仅在 bias、output 的 N 维度也等于 0 时支持），C 维度大小的支持情况与输入 x 的 C 维度一致。
当 x 和 filter 数据类型是 HIFLOAT8 时，bias 数据类型会转成 FLOAT 参与计算。

张量	x	filter	bias	y
数据类型	FLOAT16	FLOAT16	FLOAT16	FLOAT16
	BFLOAT16	BFLOAT16	BFLOAT16	BFLOAT16
	FLOAT	FLOAT	FLOAT	FLOAT
	HIFLOAT8	HIFLOAT8	FLOAT	HIFLOAT8
数据格式	NCHW	NCHW	ND	NCHW
数据格式	NHWC	HWCN	ND	NHWC

x、filter、bias、scale、y 中每一组 tensor 的每一维大小都应不大于 1000000。
groups ∈ [1, 65535]。
如果任何参数超出上述范围，算子的正确性无法保证。
由于硬件资源限制，算子在部分参数取值组合场景下会执行失败，请根据日志信息提示分析并排查问题。若无法解决，请单击 Link 获取技术支持。

调用说明

调用方式	调用样例	说明
aclnn调用	test_aclnn_conv2d_v2	通过 aclnnConvolution 接口方式调用 Conv2DV2 算子。