super_kernel

功能说明

图执行过程中,标记图内能融合为SuperKernel的上下文算子范围,详细功能介绍参见图内标定SuperKernel范围

函数原型

super_kernel(scope: str, options: str = '')

参数说明

参数 输入/输出 说明
scope 输入 字符串类型,表示上下文算子被融合的SuperKernel名,相同的scope代表相同的范围,由用户控制。若传入None,表示该范围内的算子不进行SuperKernel融合。
options 输入 字符串类型,表示融合的SuperKernel编译选项。系统编译模式默认采用所有编译选项的默认值,编译选项详细介绍参考图内标定SuperKernel范围。同时支持用户自定义组合编译选项,配置格式形如<option1>=<value1>:<option2>=<value2>:<option3>=......,多个选项时用英文冒号分割。

返回值说明

约束说明

  • 本接口仅适用于GE图模式场景,并且需要为静态图场景。
  • 需要注意的是,SuperKernel融合会按网络中算子顺序依次识别能否被融合,若识别到不可融合的算子,生成第一段SuperKernel,同时自动跳过该算子进行第二段SuperKernel融合。
  • 目前支持SuperKernel融合的通信类算子包括AllReduce、ReduceScatter、AllGather、AlltoAll。
  • with语句块内不支持断图。

调用示例

参考使用示例