算子在线编译选项
功能简介
模型编译时,支持用户在线编译和使用编译好的算子二进制文件。用户根据实际情况自行设置。
使用约束
本功能仅适用于GE图模式场景。
使用方法
该功能通过torchair.get_npu_backend中compiler_config配置,示例如下,仅供参考不支持直接拷贝运行,参数说明参见下表。
import torch_npu, torchair
config = torchair.CompilerConfig()
# 算子在线编译选项配置
config.experimental_config.jit_compile = "auto"
npu_backend = torchair.get_npu_backend(compiler_config=config)
opt_model = torch.compile(model, backend=npu_backend)
表 1 参数说明
| 参数名 | 说明 |
|---|---|
| jit_compile | 算子编译方式,默认值为“auto”。当前仅支持“auto”,系统自行判断编译方式。 针对静态shape网络,选择在线编译算子。 针对动态shape网络,优先查找系统中已编译好的算子二进制,如果查找不到对应的二进制,再在线编译算子。 |