torch.nn.functional

Note

若API“是否支持”为“是”，“限制与说明”为“-”，说明此API和原生API支持度保持一致。

API名称	是否支持	限制与说明
torch.nn.functional.conv1d	是	支持fp16，fp32
torch.nn.functional.conv2d	是	支持bf16，fp16，fp32
torch.nn.functional.conv3d	是	支持bf16，fp16，fp32，complex64
torch.nn.functional.conv_transpose1d	是	支持fp32
torch.nn.functional.conv_transpose2d	是	支持fp16，fp32
torch.nn.functional.conv_transpose3d	是	支持bf16，fp16，fp32
torch.nn.functional.unfold	是	支持bf16，fp16，fp32
torch.nn.functional.fold	是	支持fp16，fp32
torch.nn.functional.avg_pool1d	是	支持bf16，fp16，fp32
torch.nn.functional.avg_pool2d	是	支持bf16，fp16，fp32
torch.nn.functional.avg_pool3d	否	-
torch.nn.functional.max_pool1d	否	-
torch.nn.functional.max_pool2d	是	支持bf16，fp16，fp32 通过设置torch_npu.npu.use_compatible_impl(True)，保证与社区同名接口在内存一致性上对齐
torch.nn.functional.max_pool3d	是	支持bf16，fp16，fp32 dilation的值目前在NPU上仅支持设置为1或(1,1,1) return_indices为true时，返回的argmax的数据类型为int32
torch.nn.functional.max_unpool1d	是	支持fp16，fp32，fp64，uint8，int8，int32，int64
torch.nn.functional.max_unpool2d	是	支持fp16，fp32，fp64，uint8，int8，int32，int64 jit_compile=False即二进制模式时，output_size的乘积需要大于等于input的H，W的乘积
torch.nn.functional.max_unpool3d	否	-
torch.nn.functional.lp_pool1d	是	支持fp16，fp32
torch.nn.functional.lp_pool2d	是	支持fp16，fp32
torch.nn.functional.adaptive_max_pool1d	否	-
torch.nn.functional.adaptive_max_pool2d	否	-
torch.nn.functional.adaptive_max_pool3d	是	支持fp32，fp64
torch.nn.functional.adaptive_avg_pool1d	是	支持fp16，fp32
torch.nn.functional.adaptive_avg_pool2d	是	支持bf16，fp16，fp32
torch.nn.functional.adaptive_avg_pool3d	是	支持bf16，fp16，fp32
torch.nn.functional.fractional_max_pool2d	是	可能回退至CPU执行
torch.nn.functional.fractional_max_pool3d	是	-
torch.nn.functional.scaled_dot_product_attention 在当前版本中，sdpa（scaled_dot_product_attention）接口仅作为一项试用特性，此功能在后续版本中可能会有所调整或改进。请用户在使用过程中关注后续版本的迭代。	Atlas A2 训练系列产品/Atlas A3 训练系列产品：是	支持bf16、fp16和fp32。所有参数输入均符合以下约束约束：所有参数输入符合规格： • 输入query、key、value的N：batch size，当前只支持[N，head_num, S(L), E(Ev)]的排布方式，取值范围1~2K • 输入query的head num和key/value的head num必须成比例关系，即Nq/Nkv必须是非0整数，取值范围1~256 • 输入query的L：Target sequence length，取值范围1~512K • 输入key、value的S：Source sequence length，取值范围1~512K 输入query、key、value的E：Embedding dimension of the query and key，取值范围1~512 • 输入value的Ev：Embedding dimension of the value，必须与E相等 • 输入attn_mask：当前支持[N, 1, L, S]、[N, head_num, L, S]、[1, 1, L, S]、[L, S]共4种排布方式 • 在使能is_causal计算时，attn_mask必须为None；不使能is_causal时，若attn_mask输入有效数据，输入数据类型必须是Bool类型 • 输入query、key、value的数据类型bf16、fp16、fp32 与原接口除了规格限制之外差异点： • NPU的随机算法部分用DSA硬件实现，算法在DSA引擎固化与GPU算法实现存在差异，导致dropout功能和GPU结果不一致 • 当前接口支持输入query的head num和key/value的head num不等长，而原生PyTorch接口不支持
torch.nn.functional.threshold	是	支持fp16，fp32，uint8，int8，int16，int32，int64 当输入为超过16,777,216（即2²⁴）的int32类型时，精度会有损失
torch.nn.functional.threshold_	是	支持fp16，fp32，uint8，int8，int16，int32，int64 当输入为超过16,777,216（即2²⁴）的int32类型时，精度会有损失
torch.nn.functional.relu	是	支持bf16，fp16，fp32，uint8，int8，int32，int64
torch.nn.functional.relu_	是	支持bf16，fp16，fp32，uint8，int8，int32，int64
torch.nn.functional.hardtanh	是	支持bf16，fp16，fp32，fp64，uint8，int8，int16，int32，int64
torch.nn.functional.hardtanh_	是	支持fp16，fp32，int8，int16，int32，int64
torch.nn.functional.hardswish	是	支持fp16，fp32 可能回退至CPU执行
torch.nn.functional.relu6	是	支持bf16，fp16，fp32，fp64，uint8，int8，int16，int32，int64
torch.nn.functional.elu	是	支持bf16，fp16，fp32，fp64
torch.nn.functional.elu_	是	支持fp16，fp32
torch.nn.functional.selu	是	支持fp16，fp32 fp16的反向场景下对比GPU存在精度累加误差，可以通过如下方式进行规避：将正向调用的torch.nn.functional.selu替换成torch.ops.aten.elu，例如：将torch.nn.functional.selu(input_x)替换为torch.ops.aten.elu(input_x, 1.6732632423543772848170429916717, 1.0507009873554804934193349852946)
torch.nn.functional.celu	是	支持fp16，fp32
torch.nn.functional.leaky_relu	是	支持bf16，fp16，fp32，fp64
torch.nn.functional.leaky_relu_	是	支持fp16，fp32，fp64
torch.nn.functional.prelu	是	支持fp16，fp32 input仅支持1-8维
torch.nn.functional.rrelu	是	支持bf16，fp16，fp32
torch.nn.functional.glu	是	支持bf16，fp16，fp32，fp64
torch.nn.functional.gelu	是	支持bf16，fp16，fp32 approximate参数仅支持设置为tanh
torch.nn.functional.logsigmoid	是	支持fp16，fp32
torch.nn.functional.hardshrink	是	支持fp16，fp32
torch.nn.functional.softsign	是	支持bf16，fp16，fp32，uint8，int8，int16，int32，int64
torch.nn.functional.softplus	是	支持bf16，fp16，fp32
torch.nn.functional.softmax	是	支持bf16，fp16，fp32，fp64
torch.nn.functional.softshrink	是	支持fp16，fp32
torch.nn.functional.gumbel_softmax	否	-
torch.nn.functional.log_softmax	是	支持bf16，fp16，fp32
torch.nn.functional.tanh	是	支持fp16，fp32，uint8，int8，int16，int32，int64，bool
torch.nn.functional.sigmoid	是	支持fp16，fp32，uint8，int8，int16，int32，int64，bool，complex64，complex128
torch.nn.functional.hardsigmoid	是	支持fp16，fp32
torch.nn.functional.silu	是	支持bf16，fp16，fp32
torch.nn.functional.mish	是	支持fp16，fp32
torch.nn.functional.batch_norm	是	支持fp16，fp32 weight和bias仅支持一维场景 bias的shape为1维，长度与input入参中channel轴的长度相等
torch.nn.functional.group_norm	是	支持bf16，fp16，fp32 该API仅支持2维及以上的输入input eps参数需大于0
torch.nn.functional.layer_norm	是	支持bf16，fp16，fp32
torch.nn.functional.normalize	是	支持bf16，fp16，fp32，fp64
torch.nn.functional.linear	是	支持bf16，fp16，fp32
torch.nn.functional.bilinear	是	支持bf16，fp16，fp32
torch.nn.functional.dropout	是	支持bf16，fp16，fp32，fp64，uint8，int8，int16，int32，int64，bool，complex64，complex128
torch.nn.functional.alpha_dropout	是	支持bf16，fp16，fp32，uint8，int8，int16，int32，int64，bool，complex64，complex128
torch.nn.functional.feature_alpha_dropout	是	支持bf16，fp16，fp32，uint8，int8，int16，int32，int64，bool，complex64，complex128
torch.nn.functional.dropout2d	是	支持bf16，fp16，fp32，fp64，uint8，int8，int16，int32，int64，bool，complex64，complex128
torch.nn.functional.embedding	是	支持bf16，fp16，fp32，int32，int64 属性max_norm仅支持非负值
torch.nn.functional.embedding_bag	否	-
torch.nn.functional.one_hot	是	支持int64
torch.nn.functional.cosine_similarity	是	支持fp16，fp32
torch.nn.functional.pdist	否	-
torch.nn.functional.binary_cross_entropy	是	支持bf16，fp16，fp32
torch.nn.functional.binary_cross_entropy_with_logits	是	支持bf16，fp16，fp32
torch.nn.functional.poisson_nll_loss	是	支持bf16，fp16，fp32，int64 可能回退至CPU执行
torch.nn.functional.cross_entropy	是	支持fp16，fp32
torch.nn.functional.ctc_loss	是	支持fp32，fp64 目标序列的长度不支持0，即属性target_lengths的取值不能包含0
torch.nn.functional.gaussian_nll_loss	是	支持bf16，fp16，fp32，uint8，int8，int16，int32，int64
torch.nn.functional.kl_div	是	支持bf16，fp16，fp32 当前log_target参数仅支持False 当前target不支持求导
torch.nn.functional.l1_loss	是	支持bf16，fp16，fp32，int64
torch.nn.functional.mse_loss	是	支持bf16，fp16，fp32，fp64，uint8，int8，int16，int32，int64，complex64，complex128
torch.nn.functional.margin_ranking_loss	是	支持bf16，fp16，fp32
torch.nn.functional.multilabel_margin_loss	是	支持fp16，fp32 输入tensor的元素个数不能超过10万
torch.nn.functional.multilabel_soft_margin_loss	否	-
torch.nn.functional.nll_loss	是	支持fp32 target每一维的维度应该大于等于0且小于input的类别数
torch.nn.functional.smooth_l1_loss	是	支持bf16，fp16，fp32
torch.nn.functional.soft_margin_loss	是	支持bf16，fp16，fp32，不支持double，complex64，complex128数据类型
torch.nn.functional.triplet_margin_loss	否	-
torch.nn.functional.triplet_margin_with_distance_loss	否	-
torch.nn.functional.pixel_shuffle	是	支持bf16，fp16，fp32，fp64，uint8，int8，int16，int32，int64，bool，complex64，complex128
torch.nn.functional.pixel_unshuffle	是	支持bf16，fp16，fp32，fp64，uint8，int8，int16，int32，int64，bool
torch.nn.functional.pad	是	属性mode为constant时，支持bf16，fp16，fp32，fp64，uint8，int8，int16，int32，int64，bool 属性mode非constant时，支持fp16，fp32，fp64 在输入x为六维以上时可能会出现性能下降问题
torch.nn.functional.interpolate	是	支持bf16，fp16，fp32，fp64 支持nearest，linear，bilinear，bicubic，trilinear，area 不支持scale_factors
torch.nn.functional.upsample	是	支持fp16，fp32，fp64 只支持mode = nearest
torch.nn.functional.upsample_nearest	是	支持fp16，fp32，fp64 只支持3-5维
torch.nn.functional.upsample_bilinear	是	支持fp16，fp32
torch.nn.functional.grid_sample	是	支持fp16，fp32，fp64
torch.nn.functional.affine_grid	是	支持fp16，fp32
torch.nn.parallel.data_parallel	否	-