Compute

功能说明

用户表达Compute运算逻辑关系的静态配置,XxxCompute用户自定义命名,一般算子名+Compute,Compute()函数定义固化写法。

所属头文件链接

NA

函数原型

struct XxxCompute {
  template <template class Tensor>
  __host_aicore__ constexpr auto Compute() const
}

参数说明

参数名称 参数类型 输入/输出 数据类型 参数说明 默认值
Tensor 模板参数 输入 NA 根据运行的不同层次,实例化成不同的Tensor类型,DeviceTensor/GlobalTensor/BlockTensor NA

返回值说明

返回值数据类型 返回值说明
Atvoss::Expression 返回一个表达式类型,表示用户Compute的逻辑

约束说明

NA

使用示例

template <typename InputDtype, typename OutputDtype>
struct AddSubConfig {

    // 🔥🔥🔥 使用示例 🔥🔥🔥
    struct AddSubCompute {
        template <template <typename> class Tensor>
        __host_aicore__ constexpr auto Compute() const
        {
            auto in1 = Atvoss::PlaceHolder<1, Tensor<InputDtype>, Atvoss::ParamUsage::IN>();
            auto in2 = Atvoss::PlaceHolder<2, Tensor<InputDtype>, Atvoss::ParamUsage::IN>();
            auto in3 = Atvoss::PlaceHolder<3, InputDtype, Atvoss::ParamUsage::IN>();
            auto out = Atvoss::PlaceHolder<4, Tensor<OutputDtype>, Atvoss::ParamUsage::OUT>();
            return (out = in1 + in2 - in3);
        };
    };
    // 🔥🔥🔥 使用示例 🔥🔥🔥

    using ArchTag = Atvoss::Arch::DAV_3510;
    using BlockOp = Atvoss::Ele::BlockBuilder<AddSubCompute, ArchTag>;
    using KernelOp = Atvoss::Ele::KernelBuilder<BlockOp>;
    using DeviceOp = Atvoss::DeviceAdapter<KernelOp>;
};

template <typename InputDtype, typename OutputDtype>
static void Run() {
    /* ACL init and stream create */
    ...

    Atvoss::Tensor<InputDtype> in1(deviceIn1, {{3, 4, 0, 0, 0, 0, 0, 0}}, 2);
    Atvoss::Tensor<InputDtype> in2(deviceIn2, {{3, 4, 0, 0, 0, 0, 0, 0}}, 2);
    InputDtype in3 = 5.0;
    Atvoss::Tensor<OutputDtype> out(deviceOut, {{3, 4, 0, 0, 0, 0, 0, 0}}, 2);

    auto arguments = Atvoss::ArgumentsBuilder{}.inputOutput(in1, in2, in3, out).attr("dim", 5).build();

    using DeviceOp = typename AddSubConfig<InputDtype, OutputDtype>::DeviceOp;
    DeviceOp deviceOp;
    deviceOp.Run(arguments, stream);
}

int main(int argc, char const* argv[]) {
    Run<float, float>();
    return 0;
}