aclmdlLoadFromMemWithMem
产品支持情况
产品
|
是否支持
|
Atlas A3 训练系列产品/Atlas A3 推理系列产品
|
√
|
Atlas A2 训练系列产品/Atlas A2 推理系列产品
|
√
|
功能说明
从内存加载离线模型数据,由用户自行管理模型运行的内存。
函数原型
aclError aclmdlLoadFromMemWithMem(const void *model, size_t modelSize, uint32_t *modelId, void *workPtr, size_t workSize, void *weightPtr, size_t weightSize)
参数说明
参数名
|
输入/输出
|
说明
|
model
|
输入
|
存放模型数据的内存地址指针。
Ascend EP形态下,此处需申请Host上的内存。
|
modelSize
|
输入
|
模型数据长度,单位Byte。
|
modelId
|
输出
|
模型ID的指针。
系统成功加载模型后,返回模型ID作为后续操作时识别模型的标志。
|
workPtr
|
输入
|
Device上模型所需工作内存(存放模型执行过程中的临时数据)的地址指针,由用户自行管理,模型执行过程中不能释放该内存。
如果在workPtr参数处传入空指针,表示由系统管理内存。
由用户自行管理工作内存时,如果多个模型串行执行,支持共用同一个工作内存,但用户需确保模型的串行执行顺序、且工作内存的大小需按多个模型中最大工作内存的大小来申请,例如通过以下方式保证串行: - 同步模型执行时,加锁,保证执行任务串行。
- 异步模型执行时,使用同一个stream,保证执行任务串行。
|
workSize
|
输入
|
模型所需工作内存的大小,单位Byte。workPtr为空指针时无效。
|
weightPtr
|
输入
|
Device上模型权值内存(存放权值数据)的地址指针,由用户自行管理,模型执行过程中不能释放该内存。
如果在weightPtr参数处传入空指针,表示由系统管理内存。
由用户自行管理权值内存时,在多线程场景下,对于同一个模型,如果在每个线程中都加载了一次,支持共用weightPtr,因为weightPtr内存在推理过程中是只读的。此处需注意,在共用weightPtr期间,不能释放weightPtr。
|
weightSize
|
输入
|
模型所需权值内存的大小,单位Byte。weightPtr为空指针时无效。
|
返回值说明
返回0表示成功,返回其他值表示失败,请参见aclError。
参考资源
当前还提供了aclmdlSetConfigOpt接口、aclmdlLoadWithConfig接口来实现模型加载,通过配置对象中的属性来区分,在加载模型时是从文件加载,还是从内存加载,以及内存是由系统内部管理,还是由用户管理。