MulAddn

产品支持情况

算子功能：

实现 n>=2个mul和addn融合计算，减少搬运时间和内存的占用。
计算公式：

输入x1， x2为变长输入，为N个tensor组成的列表。x1输入中的每个tensor shape都为[B, M, 1], x2输入中的每个tensor shape都为[B, 1, K], y为输出，shape为[B, M, K]; N对应为addn算子的n数量，也为融合算子融合mul的数量。

x 1 * x 2 = y

x 1 = [[B, M, 1], [B, M, 1], . . ., [B, M, 1]] (共 N 个 [B, M, 1])

x 2 = [[B, 1, K], [B, 1, K], . . ., [B, 1, K]] (共 N 个 [B, 1, K])

[[B, M, 1], [B, M, 1], . . ., [B, M, 1]] * [[B, 1, K], [B, 1, K], . . ., [B, 1, K]] = y

参数名	输入/输出/属性	描述	数据类型	数据格式
x1	输入	公式中的输入x1。	FLOAT16、FLOAT32、BFLOAT16	ND
x2	输入	公式中的输入x2。	FLOAT16、FLOAT32、BFLOAT16	ND
N	属性	融合算子mul的数量。	INT	-
y	输出	公式中的y。	FLOAT16、FLOAT32、BFLOAT16	ND

调用方式	调用样例	说明
图模式调用	test_geir_mul_addn	通过算子IR构图方式调用MulAddn算子。