0_dump_args
描述
本用例展示了单算子执行场景下如何管理Dump算子信息,并将算子信息文件输出到path参数指定的目录,主线程中设置Device,一个shape对应一个算子信息文件,文件中包含算子类型、算子属性、算子输入&输出的format/数据类型/shape等信息。
支持的产品型号
- Atlas A3 训练系列产品/Atlas A3 推理系列产品
- Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件
- Atlas 训练系列产品
编译运行
环境安装详情以及运行详情请见example目录下的README。
CANN RUNTIME API
在该sample中,涉及的关键功能点及其关键接口,如下所示:
- 初始化
- 调用aclInit接口初始化AscendCL配置。
- 调用aclopStartDumpArgs接口使能Dump算子信息。
- 调用aclopStopDumpArgs接口去使能Dump算子信息。
- 调用aclFinalize接口实现AscendCL去初始化。
- Device管理
- 调用aclrtSetDevice接口指定用于运算的Device。
- 调用aclrtSynchronizeDevice接口阻塞等待正在运算中的Device完成运算。
- 调用aclrtResetDeviceForce接口强制复位当前运算的Device,回收Device上的资源。
- Stream管理
- 调用aclrtCreateStream接口创建Stream。
- 调用aclrtSynchronizeStream接口阻塞等待Stream上任务的完成。
- 调用aclrtDestroyStream接口销毁Stream。
- 内存管理
- 调用aclrtMalloc接口申请Device上的内存。
- 调用aclrtFree接口释放Device上的内存。
- 数据传输
- 调用aclrtMemcpy接口通过内存复制的方式实现数据传输。
已知issue
暂无