AccumulateNv2
产品支持情况
| 产品 | 是否支持 |
|---|---|
| Ascend 950PR/Ascend 950DT | √ |
| Atlas A3 训练系列产品/Atlas A3 推理系列产品 | √ |
| Atlas A2 训练系列产品/Atlas A2 推理系列产品 | √ |
| Atlas 200I/500 A2 推理产品 | × |
| Atlas 推理系列产品 | √ |
| Atlas 训练系列产品 | √ |
功能说明
-
算子功能:返回输入tensors列表中每个输入tensor依次做add求和。AccumulateNv2与AddN执行相同的运算,但不等待所有输入就绪后再开始求和,可在输入就绪时间不同时节省内存。
-
计算公式:
y=∑i=0N−1xiy = \sum_{i=0}^{N-1} x_i
参数说明
| 参数名 | 输入/输出/属性 | 描述 | 数据类型 | 数据格式 |
|---|---|---|---|---|
| x | 输入(动态输入) | 需要求和的输入tensor列表,公式中的x_i。各tensor的shape需满足broadcast关系。 | FLOAT16、FLOAT、INT8、INT32、UINT8 | ND |
| y | 输出 | 求和结果tensor,公式中的y。 | FLOAT16、FLOAT、INT8、INT32、UINT8 | ND |
| N | 属性(必填) | 输入tensor列表的大小。 | INT | - |
约束说明
- 确定性计算:aclnnSum默认确定性实现。
- 输入tensors列表中各tensor的shape需满足broadcast关系,broadcast后的shape需与输出y的shape一致。
- 输入tensors与输出的数据类型需相同。
调用说明
| 调用方式 | 调用样例 | 说明 |
|---|---|---|
| aclnn调用 | test_aclnn_sum | 通过aclnnSum接口方式调用AccumulateNv2算子。 |