Addcmul算子样例
概述
样例概述:本样例介绍了利用ATVC实现Addcmul单算子并完成功能验证
- 算子功能:Addcmul
- 使用的ATVC模板:带前置Elementwise计算和后置Elementwise计算的Broadcast模板
- 调用方式:Kernel直调
样例支持AI处理器型号:
- Ascend 910C
- Ascend 910B
算子描述
算子数学计算公式:outputi=inputi+value∗tensor1i∗tensor2ioutput_i = input_i + value * tensor1_i * tensor2_i
算子规格:
| 算子类型(OpType) | Add | |||
| 算子输入 | ||||
| name | shape | data type | format | |
| input | 8 * 2048 | float | ND | |
| tensor1 | 1 * 2048 | float | ND | |
| tensor2 | 1 * 2048 | float | ND | |
| 算子输出 | ||||
| output | 8 * 2048 | float | ND | |
| 核函数名 | AddcmulCustom | |||
目录结构
| 文件名 | 描述 |
|---|---|
| addcmul.cpp | Addcmul算子代码实现以及调用样例 |
| addcmul.h | Addcmul算子代码实现头文件 |
| post_compute_add_of_broadcast.h | 后置Elementwise计算 |
| pre_compute_mul_of_broadcast.h) | 前置Elementwise计算 |
算子运行
在ascendc-api-adv代码仓目录下执行:
cd ./ops_templates/atvc/examples
bash run_examples.sh addcmul