DefaultKernelSchedule

功能说明

默认的kernel层schedule调度策略,实现完全继承BaseKernelSchedule的能力,根据DefaultKernelConfig的切分参数配置,实现kernel层级的调度逻辑。

所属头文件链接

/include/elewise/kernel/schedule.h

函数原型

template <typename BlockOp, const auto& Policy, typename ScheduleCfg>
class DefaultKernelSchedule : public BaseKernelSchedule<BlockOp, Policy, ScheduleCfg>

参数说明

参数名称 参数类型 输入/输出 数据类型 参数说明 默认值
BlockOp 模板参数 输入 NA block层对象类型,跟kernel层是被包含关系 NA
Policy 模板参数 输入 NA kernel层的用户静态策略类型 NA
ScheduleCfg 模板参数 输入 NA kernel层调度配置类型 NA

返回值说明

返回值数据类型 返回值说明
DefaultKernelSchedule 返回默认的kernel层schedule调度策略

约束说明

NA

使用示例

template <typename InputDtype, typename OutputDtype>
struct AddSubConfig {
    struct AddSubCompute {
        template <template <typename> class Tensor>
        __host_aicore__ constexpr auto Compute() const
        {
            auto in1 = Atvoss::PlaceHolder<1, Tensor<InputDtype>, Atvoss::ParamUsage::IN>();
            auto in2 = Atvoss::PlaceHolder<2, Tensor<InputDtype>, Atvoss::ParamUsage::IN>();
            auto in3 = Atvoss::PlaceHolder<3, InputDtype, Atvoss::ParamUsage::IN>();
            auto out = Atvoss::PlaceHolder<4, Tensor<OutputDtype>, Atvoss::ParamUsage::OUT>();
            return (out = in1 + in2 - in3);
        };
    };

    static constexpr Atvoss::Ele::DefaultKernelPolicy kernelPolicy{Atvoss::Ele::DefaultSegmentPolicy::UniformSegment};
    using ArchTag = Atvoss::Arch::DAV_3510;
    using BlockOp = Atvoss::Ele::BlockBuilder<AddSubCompute, ArchTag>;
    using KernelOp = Atvoss::Ele::KernelBuilder<
      BlockOp, 
      kernelPolicy,
      Atvoss::Ele::DefaultKernelConfig,

      // 🔥🔥🔥 使用示例 🔥🔥🔥
      Atvoss::Ele::DefaultKernelSchedule
      // 🔥🔥🔥 使用示例 🔥🔥🔥
      
      >;

    using DeviceOp = Atvoss::DeviceAdapter<KernelOp>;
};

template <typename InputDtype, typename OutputDtype>
static void Run() {
    /* ACL init and stream create */
    ...

    Atvoss::Tensor<InputDtype> in1(deviceIn1, {{3, 4, 0, 0, 0, 0, 0, 0}}, 2);
    Atvoss::Tensor<InputDtype> in2(deviceIn2, {{3, 4, 0, 0, 0, 0, 0, 0}}, 2);
    InputDtype in3 = 5.0;
    Atvoss::Tensor<OutputDtype> out(deviceOut, {{3, 4, 0, 0, 0, 0, 0, 0}}, 2);

    auto arguments = Atvoss::ArgumentsBuilder{}.inputOutput(in1, in2, in3, out).attr("dim", 5).build();

    using DeviceOp = typename AddSubConfig<InputDtype, OutputDtype>::DeviceOp;
    DeviceOp deviceOp;
    deviceOp.Run(arguments, stream);
}

int main(int argc, char const* argv[]) {
    Run<float, float>();
    return 0;
}