aclmdlExecuteAsync

产品支持情况

产品

是否支持

Atlas A3 训练系列产品/Atlas A3 推理系列产品

Atlas A2 训练系列产品/Atlas A2 推理系列产品

功能说明

执行模型推理。异步接口。

函数原型

aclError aclmdlExecuteAsync(uint32_t modelId, const aclmdlDataset *input, aclmdlDataset *output, aclrtStream stream)

参数说明

参数名

输入/输出

说明

modelId

输入

指定需要执行推理的模型的ID。

调用模型加载接口(例如aclmdlLoadFromFile接口、aclmdlLoadFromMem等)成功后,会返回模型ID,该ID作为本接口的输入。

input

输入

模型推理的输入数据的指针。

output

输出

模型推理的输出数据的指针。

stream

输入

指定Stream。

返回值说明

返回0表示成功,返回其他值表示失败,请参见aclError

约束说明

  • 对同一个modelId的模型,不能调用aclmdlExecuteAsync接口执行多Stream并发场景下的模型推理。错误示例如下,该示例中,两次aclmdlExecuteAsync接口多Stream并发执行,导致报错:

    //......
    aclmdlExecuteAsync(modelId1, input, output, stream1);
    aclmdlExecuteAsync(modelId1, input, output, stream2);
    aclrtSynchronizeStream(stream1);
    aclrtSynchronizeStream(stream2);
    //......
    
  • 若由于业务需求,必须在多线程中使用同一个modelId,则用户线程间需加锁,保证刷新输入输出内存、保证执行是连续操作,例如:

    // 线程A的接口调用顺序:
    lock(handle1) -> aclrtMemcpyAsync(stream1)刷新输入输出内存 -> aclmdlExecuteAsync(modelId1,stream1)执行推理 -> unlock(handle1)
    
    // 线程B的接口调用顺序:
    lock(handle1) -> aclrtMemcpyAsync(stream1)刷新输入输出内存 -> aclmdlExecuteAsync(modelId1,stream1)执行推理 -> unlock(handle1)
    
  • 若需要使用外置Allocator,则注册Allocator时的stream需与模型执行时的stream保持一致。

  • 存放模型输入/输出数据的内存为Device内存,可以调用aclrtMalloc、hi_mpi_dvpp_malloc等接口申请Device内存。