aclrtLaunchKernelV2
产品支持情况
| 产品 | 是否支持 |
|---|---|
| Atlas A3 训练系列产品/Atlas A3 推理系列产品 | √ |
| Atlas A2 训练系列产品/Atlas A2 推理系列产品 | √ |
功能说明
指定任务下发的配置信息,并启动对应算子的计算任务。异步接口。
函数原型
aclError aclrtLaunchKernelV2(aclrtFuncHandle funcHandle, uint32_t blockDim, const void *argsData, size_t argsSize, aclrtLaunchKernelCfg *cfg, aclrtStream stream)
参数说明
| 参数名 | 输入/输出 | 说明 |
|---|---|---|
| funcHandle | 输入 | 核函数句柄。 |
| blockDim | 输入 | 指定核函数将会在几个核上执行。 |
| argsData | 输入 | 存放核函数所有入参数据的Device内存地址指针。 内存申请接口请参见内存管理。 注意,执行本接口下发任务的Device需与argsData中使用的Device内存要是同一个Device。 |
| argsSize | 输入 | argsData参数值的大小,单位为Byte。 |
| cfg | 输入 | 任务下发的配置信息。 不指定配置时,此处可传NULL。 |
| stream | 输入 | 指定执行任务的Stream。 |
返回值说明
返回0表示成功,返回其他值表示失败,请参见aclError。
参考资源
下表的几个接口都用于启用对应算子的计算任务,但功能和使用方式有所不同:
| 接口 | 核函数参数值的传入方式 | 核函数参数值的存放位置 | 是否可指定任务下发的配置信息 |
|---|---|---|---|
| aclrtLaunchKernel | 在接口中指定存放核函数所有入参数据的Device内存地址指针 | Device内存 | 否 |
| aclrtLaunchKernelWithConfig | 在接口中指定参数列表句柄aclrtArgsHandle | Host内存 | 是 |