op-plugin/test/test_v2r1_ops/test_layer_norm_backward.py-代码预览-op-plugin:基于昇腾Ascend Extension for PyTorch的算子插件项目 - AtomGit

Ii-robot!1490 Move UTs on PTA to OP-Plugin Part3
ea59b1ae创建于 2024年5月31日历史提交
import torch
import numpy as np
import torch_npu

from torch_npu.testing.testcase import TestCase, run_tests
from torch_npu.testing.common_utils import create_common_tensor


class TestLayerNorm(TestCase):
    weight_grad = []

    def getWeightGrad(self, grad):
        self.weight_grad.append(grad.cpu())

    def cpu_op_exec(self, input1, normalized_shape):
        input1.requires_grad_(True)
        input1.retain_grad()
        m = torch.nn.LayerNorm(normalized_shape=normalized_shape)
        res = m(input1)
        w = torch.ones_like(res)
        res.backward(w)

        grad_output = input1.grad.detach().numpy()
        grad_bias = m.bias.grad.detach().numpy()
        grad_weight = m.weight.grad.detach().numpy()
        return grad_output, grad_weight, grad_bias

    def npu_op_exec_new(self, input1, normalized_shape):
        input1.requires_grad_(True)
        input1.retain_grad()
        input1 = input1.npu()
        m = torch.nn.LayerNorm(normalized_shape=normalized_shape).npu()
        m.weight.register_hook(lambda grad: self.getWeightGrad(grad))
        res = m(input1)
        w = torch.ones_like(res)
        res.backward(w)

        grad_output = input1.grad.cpu().detach().numpy()
        grad_bias = m.bias.grad.cpu().detach().numpy()
        grad_weight = m.weight.grad.cpu().detach().numpy()
        return grad_output, grad_weight, grad_bias

    def test_layernorm_shape_format(self, device="npu"):
        shape_format = [
            [np.float32, 3, [1, 32, 11, 112]],
            [np.float16, 3, [1, 67, 7, 7]],
            [np.float16, 3, [1, 88, 14, 14]],
            [np.float16, 3, [1, 58, 28, 28]],
            [np.float16, 3, [1, 116, 14, 14]],
            [np.float16, 3, [1, 24, 12, 112]],
            [np.float16, 0, [1, 5, 56, 56]],
            [np.float16, 0, [1, 5, 56, 56]],
            [np.float16, 2, [1, 24, 28, 28]],
            [np.float16, 2, [1, 16, 28, 28]],
            [np.float16, 29, [1, 232, 7, 7]],
            [np.float16, 29, [1, 23, 14, 14]],
        ]
        for item in shape_format:
            cpu_input, npu_input = create_common_tensor(item, 1, 100)
            if cpu_input.dtype == torch.float16:
                cpu_input = cpu_input.to(torch.float32)

            cpu_grad_output, cpu_grad_weight, cpu_grad_bias = self.cpu_op_exec(cpu_input, item[2][3])
            npu_grad_output, npu_grad_weight, npu_grad_bias = self.npu_op_exec_new(npu_input, item[2][3])

            cpu_grad_output = cpu_grad_output.astype(npu_grad_output.dtype)
            cpu_grad_weight = cpu_grad_weight.astype(npu_grad_weight.dtype)
            cpu_grad_bias = cpu_grad_bias.astype(npu_grad_bias.dtype)

            self.assertRtolEqual(cpu_grad_output, npu_grad_output)
            # TODO(ascend): Insufficient precision
            # npu_grad_weight精度未满足要求
            self.assertRtolEqual(cpu_grad_weight, npu_grad_weight)
            self.assertRtolEqual(cpu_grad_bias, npu_grad_bias)


if __name__ == "__main__":
    np.random.seed(20)
    run_tests()