graph-autofusion/autofuse/common/common_utils.h-代码预览-graph-autofusion:基于昇腾芯片的自动融合加速组件项目 - AtomGit

/**
 * Copyright (c) 2025 Huawei Technologies Co., Ltd.
 * This program is free software, you can redistribute it and/or modify it under the terms and conditions of 
 * CANN Open Software License Agreement Version 2.0 (the "License").
 * Please refer to the License for details. You may not use this file except in compliance with the License.
 * THIS SOFTWARE IS PROVIDED ON AN "AS IS" BASIS, WITHOUT WARRANTIES OF ANY KIND, EITHER EXPRESS OR IMPLIED, 
 * INCLUDING BUT NOT LIMITED TO NON-INFRINGEMENT, MERCHANTABILITY, OR FITNESS FOR A PARTICULAR PURPOSE.
 * See LICENSE in the root of the software repository for the full text of the License.
 */

#ifndef __COMMON_UTILS_H__
#define __COMMON_UTILS_H__

#include <string>
#include "graph/symbolizer/symbolic.h"
#include "external/ge_common/ge_api_types.h"
#include "graph/ascendc_ir/ascendc_ir_core/ascendc_ir.h"
#include "graph/ascendc_ir/ascir_registry.h"
#include "ascir.h"
#include "schedule_result.h"
#include "symbolizer/symbolic_utils.h"

namespace ascgen_utils {
  const string INVALID_TILING = "invalid_tiling";
  constexpr int32_t NOT_SUPPORT_BRC_INLINE = -1;

  const std::string kKernelTaskTypeAIVOnly = "KERNEL_TYPE_AIV_ONLY";
  const std::string kKernelTaskTypeMixAIVOneZero = "KERNEL_TYPE_MIX_AIV_1_0";
  const std::string kKernelTaskTypeAICOnly = "KERNEL_TYPE_AIC_ONLY";
  const std::string kKernelTaskTypeMixAICOneTwo = "KERNEL_TYPE_MIX_AIC_1_2";
  const std::string kKernelTaskTypeMixAICOneOne = "KERNEL_TYPE_MIX_AIC_1_1";

  const std::string kMatMul = "MatMul";
  const std::string kMatMulBias = "MatMulBias";
  const std::string kMatMulOffset = "MatMulOffset";
  const std::string kMatMulOffsetBias = "MatMulOffsetBias";
  const std::string kBatchMatMul = "BatchMatMul";
  const std::string kBatchMatMulBias = "BatchMatMulBias";
  const std::string kBatchMatMulOffset = "BatchMatMulOffset";
  const std::string kBatchMatMulOffsetBias = "BatchMatMulOffsetBias";
  const std::string kConv2D = "Conv2D";
  const std::string kConv2DBias = "Conv2DBias";
  const std::string kConv2DOffset = "Conv2DOffset";
  const std::string kConv2DOffsetBias = "Conv2DOffsetBias";

  struct MatMulAttr {
    int64_t transpose_x1{0};
    int64_t transpose_x2{0};
    int64_t offset_x{0};
    int64_t enable_hf32{0};
    int64_t adj_x1{0};
    int64_t adj_x2{0};
    int64_t has_relu{0};
    bool is_batch{false};
    bool is_bias{false};
    bool is_offset_w{false};
    std::string output_dtype;
    std::string input_dtype;
    std::string m;
    std::string n;
    std::string k;
  };

  struct Conv2DAttr {
    std::vector<int64_t> strides;
    std::vector<int64_t> pads;
    std::vector<int64_t> dilations;
    int64_t groups{1};
    std::string pad_mode{"SPECIFIC"};
    std::string data_format{"NCHW"};
    int64_t offset_x{0};
    bool enable_hf32{false};
    bool is_bias{false};
    bool is_offset_w{false};
    std::string output_dtype;
    std::string input_dtype;
  };

#define GET_MATMUL_ATTRS(Node, AttrType, AttrData) \
    auto mm_attr = node->attr.ir_attr->DownCastTo<af::ascir_op::AttrType::Asc##AttrType##IrAttrDef>(); \
    GE_ASSERT_NOTNULL(mm_attr); \
    GE_ASSERT_SUCCESS(mm_attr->GetHas_relu(AttrData.has_relu)); \
    GE_ASSERT_SUCCESS(mm_attr->GetEnable_hf32(AttrData.enable_hf32)); \
    GE_ASSERT_SUCCESS(mm_attr->GetOffset_x(AttrData.offset_x)); \
    GE_ASSERT_SUCCESS(mm_attr->GetTranspose_x1(AttrData.transpose_x1)); \
    GE_ASSERT_SUCCESS(mm_attr->GetTranspose_x2(AttrData.transpose_x2));

#define GET_BATCH_MATMUL_ATTRS(Node, AttrType, AttrData) \
    auto mm_attr = node->attr.ir_attr->DownCastTo<af::ascir_op::AttrType::Asc##AttrType##IrAttrDef>(); \
    GE_ASSERT_NOTNULL(mm_attr); \
    GE_ASSERT_SUCCESS(mm_attr->GetHas_relu(AttrData.has_relu)); \
    GE_ASSERT_SUCCESS(mm_attr->GetEnable_hf32(AttrData.enable_hf32)); \
    GE_ASSERT_SUCCESS(mm_attr->GetOffset_x(AttrData.offset_x)); \
    GE_ASSERT_SUCCESS(mm_attr->GetAdj_x1(AttrData.adj_x1)); \
    GE_ASSERT_SUCCESS(mm_attr->GetAdj_x2(AttrData.adj_x2));

#define GET_CONV2D_ATTRS(Node, AttrType, AttrData) \
    auto conv_attr = node->attr.ir_attr->DownCastTo<af::ascir_op::AttrType::Asc##AttrType##IrAttrDef>(); \
    GE_ASSERT_NOTNULL(conv_attr); \
    GE_ASSERT_SUCCESS(conv_attr->GetStrides(AttrData.strides)); \
    GE_ASSERT_SUCCESS(conv_attr->GetPads(AttrData.pads)); \
    GE_ASSERT_SUCCESS(conv_attr->GetDilations(AttrData.dilations)); \
    GE_ASSERT_SUCCESS(conv_attr->GetGroups(AttrData.groups)); \
    GE_ASSERT_SUCCESS(conv_attr->GetPad_mode(AttrData.pad_mode)); \
    GE_ASSERT_SUCCESS(conv_attr->GetData_format(AttrData.data_format)); \
    GE_ASSERT_SUCCESS(conv_attr->GetOffset_x(AttrData.offset_x)); \
    GE_ASSERT_SUCCESS(conv_attr->GetEnable_hf32(AttrData.enable_hf32))

  struct MergeBrcAxisParams {
    const std::vector<af::Expression> &repeats;
    const std::vector<af::Expression> &strides;
    std::vector<af::Expression> repeats_no_one;
    std::vector<af::Expression> strides_no_one;
    std::vector<bool> is_axis_brc;
    std::vector<af::Expression> merge_repeats;

    MergeBrcAxisParams(const std::vector<af::Expression> &repeats, const std::vector<af::Expression> &strides)
      : repeats(repeats), strides(strides) {
      repeats_no_one.reserve(repeats.size());
      strides_no_one.reserve(strides.size());
      is_axis_brc.reserve(repeats.size());
      merge_repeats.reserve(repeats.size());
    }
  };

  std::string CamelToLowerSneak(const std::string &str);
  std::string SubStringReplace(std::string &ori, const std::string &from, const std::string &to);
  std::string GenValidName(const std::string& t_name);
  bool GetRealPath(const std::string& file_path, std::string& real_file_path);
  bool IsEmptyTensorSence(const ascir::FusedScheduledResult& fused_schedule_result);

  template <typename T>
  static std::string VectorToStr(const std::vector<T> &vec, char start = '[', char end = ']') {
    std::string result;
    result += start;
    for (size_t i = 0; i < vec.size(); ++i) {
      if constexpr (std::is_same<T, af::Expression>::value) {
        result += (vec[i].Str().get());
      } else {
        result += std::to_string(vec[i]);
      }
      if (i < vec.size() - 1) {
        result += ", ";
      }
    }
    result += end;
    return result;
  }
  af::Expression GetTensorSize(const af::AscTensor &tensor);
  af::Expression CalculateOneWorkspaceSize(const af::AscNodePtr &workspace_nodes);
  af::Expression CalculateWorkspaceSize(const std::vector<af::AscNodePtr> &workspace_nodes);
  af::Expression CalcExtraTmpBufForAscGraph(const ascir::ImplGraph &graph);
  std::vector<ascir::TensorId> GetWorkspaceTensorIdListInOneScheduleResult(const ascir::FusedScheduledResult& fused_schedule_result);

  af::Status GetApiTilingTypeName(const ascir::NodeView& node, std::string& type_name);
  af::Status GetApiTilingFieldName(const ascir::NodeView& node, std::string& field_name);
  void GetApiExtractDupSet(const ascir::ImplGraph &graph,
                         std::set<std::pair<std::string, std::string>> &pre_api_extract_dup,
                         uint32_t& total_blk_num);
  int32_t CalcReservedTmpBufSizeForAscGraph(const ascir::ImplGraph &graph);
  void GetApiReservedBlockNum(const ascir::ImplGraph &graph, uint32_t& total_blk_num);
  bool IsScalarNextNodeSupportBlkTensor(const af::AscNodePtr &node);
  bool IsUbScalarLoad(const af::AscNodePtr &node);
  bool IsStaticSchedResult(const ascir::FusedScheduledResult& fused_schedule_result);
  af::Status ScalarValuePreProcess(const std::string& ori_value,
                                 const std::string& dtype,
                                 std::string& after_pre_pro_value);
  void MergeBrcAxisRepeats(const std::vector<af::Expression> &input0_repeats,  // 输入0的vector_repeats, 带广播
                           const std::vector<af::Expression> &input1_repeats,  // 输入1的vector_repeats, 不带广播
                           const std::vector<af::Expression> &input1_strides,  // 输入1的vector_strides
                           std::vector<af::Expression> &i0_merge_repeats,     // 输入0，合并后的vector_repeats
                           std::vector<af::Expression> &i1_merge_repeats);     // 输入1，合并后的vector_repeats
  void MergeBrcAxisRepeats(MergeBrcAxisParams &in0, MergeBrcAxisParams &in1);

  bool IsGeneralizeBrcInlineScene(const af::AscNodePtr &node);
  bool IsGeneralizeBrcInlineScene(const af::AscNodePtr &node, std::vector<uint8_t> &input_idx_2_brc_inline);
  bool IsGeneralizeBrcInlineScene(const af::AscNodePtr &node, const af::AscTensor &input0,
                                  const af::AscTensor &input1, std::vector<uint8_t> &input_idx_2_brc_inline);
  bool IsSupportBlkTensorInput(const af::AscNodePtr &next_node);
  int32_t GetBrcInlineIndex(const af::AscNodePtr &node);
  bool IsLinkToBrdcst(const ascir::NodeView &node, const std::set<std::string> &brc_types);

  std::string FormatExpression(const std::string &expression);
  std::string GenUpdateCurPerfAndBlockByGroupHelper(bool with_log, bool use_std_max);
  template<typename T>
  T Gcd(T a, T b) {
    while (b != 0) {
      T tmp = b;
      b = a % b;
      a = tmp;
    }
    return a;
  }

  std::unique_ptr<af::ascir::AscIrAtt> GetAscIrAttImpl(const string &ascir_type);
  std::unique_ptr<af::ascir::AscIrCodegen> GetAscIrCodegenImpl(const string &ascir_type);

  bool IsScalarInput(const std::vector<af::Expression> &repeats);
  bool IsNodeSupportsVectorFunction(const af::AscNodePtr &node);
  bool IsNodeSupportsScalarInput(const af::AscNodePtr &node, const std::vector<bool> &is_scalar_list);
  bool IsNodeSupportsAllScalar(const af::AscNodePtr &node);
  bool IsNodeSupportsScalarIfExchangeInputs(const af::AscNodePtr &node, const std::vector<bool> &is_scalar_list);
  bool IsNodeSupportsInplace(const af::AscNodePtr &node);

  bool IsNodeSupportsBrcInline(const af::AscNodePtr &node);
  bool IsNodeContainsBrcInline(const af::AscNodePtr &node);

  inline bool ExpressEq(const af::Expression &e1, const af::Expression &e2) {
#ifdef AUTOFUSE_USE_GE_METADEF
    return ge::SymbolicUtils::StaticCheckEq(e1, e2) == ge::TriBool::kTrue;
#else
    return af::SymbolicUtils::StaticCheckEq(e1, e2) == af::TriBool::kTrue;
#endif
  }

  af::ExecuteCondition GetNodeExecCondition(const af::NodePtr &node);
  bool IsNodeCacheable(const af::NodePtr &node);
  bool IsSingleGroup(const ascir::FusedScheduledResult &fused_schedule_result);
  bool CanUseTilingKey(const ascir::FusedScheduledResult &fused_schedule_result);
  bool IsJustCubeFixpip(const ascir::FusedScheduledResult &fused_schedule_result);
  bool IsCubeFusedScheduled(const ascir::FusedScheduledResult &fused_schedule_result);
  bool IsCubeUBFusedScheduled(const ascir::FusedScheduledResult &fused_schedule_result);
  bool IsCubeCommonFusedScheduled(const ascir::FusedScheduledResult &fused_schedule_result);
  bool HasCubeUBFusedScheduled(const ascir::FusedScheduledResult &fused_schedule_result);
  bool HasCubeCommonFusedScheduled(const ascir::FusedScheduledResult &fused_schedule_result);
  bool IsCubeType(const ascir::ImplGraph &impl_graph);
  bool IsMatMulTypeWithBatch(const ascir::ImplGraph &impl_graph);
  bool IsMatMulTypeWithBias(const ascir::ImplGraph &impl_graph);
  bool IsMatMulTypeWithOffsetW(const ascir::ImplGraph &impl_graph);
  af::Status ParseMatmulAttr(const ascir::NodeView &node, MatMulAttr &mm_attr_data);
  bool IsCubeGroupType(const ascir::ScheduleGroup &sched_group);
  bool IsSatetyResultType(const ascir::ScheduledResult &sched_result);
  af::Status GetCubeOutputTypeSize(const ascir::NodeView &node, uint32_t &length);
  af::Status GetCubeInputNum(const ascir::NodeView &node, uint32_t &num);
  af::Status CreateCVFusionResult(ascir::FusedScheduledResult &elemwise_schedule_result);
  af::Status CreateCVFusionCommonResult(ascir::FusedScheduledResult &elemwise_schedule_result);
  bool IsCVFusionUBGraph(const ascir::ImplGraph &impl_graph, ascir::CubeTemplateType cv_fusion_type);
  af::Status FilterCVFusionUBResult(ascir::FusedScheduledResult &ub_schedule_result);
  af::Status FilterCVFusionCommonResult(ascir::FusedScheduledResult &common_schedule_result);
  ge::Status DtypeName(ge::DataType dtype, std::string &dtype_name);
  bool IsConv2DFusedScheduled(const ascir::FusedScheduledResult &fused_schedule_result);
  af::Status ParseConv2DAttr(const ascir::NodeView &node, Conv2DAttr &conv_attr_data);
  bool IsConv2DGraphType(const ascir::ImplGraph &impl_graph);
  bool IsConv2DTypeWithBias(const ascir::ImplGraph &impl_graph);
  bool IsConv2DTypeWithOffsetW(const ascir::ImplGraph &impl_graph);
}  // namespace ascgen_utils

#endif