ops-math/random/random_common · CANN/ops-math - AtomGit

文件	最后提交记录	最后更新时间
op_graph	优化多个文件中的代码风格 Co-authored-by: yuantao<taoyuan18@huawei.com> Co-authored-by: init__zhb__<zhanghaobo6@huawei.com> # message auto-generated for no-merge-commit merge: !1295 merge clean into master 优化多个文件中的代码风格 Created-by: yuantao_ Commit-by: init__zhb__;yuantao Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 多个文件中的代码风格可以进行改进： \| 文件路径 \| 代码片段 \| 问题描述 \| 行号 \| \| ---------------------------------------------------------------------------- \| --------------------------------------------------------------------------------------------------------- \| --------------------------- \| --- \| \| conversion/concat_d/op_api/concat_d.cpp \| `if (tail_dim * type_size[promoteType] % 32 != 0) {` \| 避免魔法数字 (32) \| 54 \| \| conversion/depth_to_space/examples/test_geir_depth_to_space.cpp \| `add1.update_output_desc_##outputName(outputName##outputIndex##_desc);` \| 宏定义无需分号 \| 68 \| \| conversion/depth_to_space/examples/test_geir_depth_to_space.cpp \| `inputs.push_back(placeholder##intputIndex);` \| 宏定义无需分号 \| 60 \| \| conversion/depth_to_space/examples/test_geir_depth_to_space.cpp \| `char endptr;` \| 使用std::string替代char \| 202 \| \| conversion/strided_slice_grad/examples/test_geir_strided_slice_grad.cpp \| `pData[i] = value + (i % 3) * 0.4f; // 让数据更有意义` \| 避免魔法数字 (3) \| 126 \| \| conversion/strided_slice_grad/examples/test_geir_strided_slice_grad.cpp \| `return 2;` \| 避免魔法数字 (2) \| 109 \| \| conversion/strided_slice_grad/examples/test_geir_strided_slice_grad.cpp \| `return 4;` \| 避免魔法数字 (4) \| 107 \| \| conversion/concat_d/op_api/concat_d.cpp \| `if (inputs->Size() > 512 \\|\\| inputs->Size() < 33) {` \| 避免魔法数字 (512) \| 45 \| \| conversion/concat_d/op_api/concat_d.cpp \| `catMaxInputSize = 512;` \| 避免魔法数字 (512) \| 92 \| \| conversion/depth_to_space/examples/test_geir_depth_to_space.cpp \| `FILE fp;` \| 变量应在使用时声明初始化 \| 153 \| \| conversion/depth_to_space/examples/test_geir_depth_to_space.cpp \| `add1.set_attr_##attrName(attrValue);` \| 宏定义无需分号 \| 63 \| \| random/dsa_random_uniform/op_host/op_api/aclnn_multinomial.cpp \| `auto randomUniform = GetRandomUniformNoReplaceMent(selfContiguous, randomParams, uniqueExecutor.get());` \| 数组参数应传递长度 (randomParams) \| 377 \| \| conversion/squeezev2/op_host/squeezev2_infershape.cpp \| `return SqueezeWithAxes(x_shape, squeeze_dims, y_shape);` \| 数组参数应传递长度 (squeeze_dims) \| 114 \| \| conversion/concat_dv2/op_host/concat_dv2_tiling.cpp \| `tiling.set_endTensorIdx(endTensorIdx);` \| 数组参数应传递长度 (endTensorIdx) \| 143 \| \| conversion/squeezev3/op_host/squeezev3_infershape.cpp \| `return SqueezeWithAxes(x_shape, squeeze_dims, y_shape);` \| 数组参数应传递长度 (squeeze_dims) \| 117 \| \| conversion/concat_dv2/op_host/concat_dv2_tiling.cpp \| `tiling.set_endTensorOffset(endTensorOffset);` \| 数组参数应传递长度 (endTensorOffset) \| 144 \| \| conversion/squeezev2/op_host/squeezev2_infershape.cpp \| `if (!IsAxesRangeValid(squeeze_dims, static_cast<int64_t>(x_shape->GetDimNum()), axes)) {` \| 数组参数应传递长度 (squeeze_dims) \| 108 \| \| random/sim_thread_exponential/op_kernel/sim_thread_exponential.h \| `AscendC::And(..., mask, len / SHIFT_LEFT_32, { 1, 1, 1, 8,` \| 数组参数应传递长度 (mask) \| 567 \| \| random/dsa_gen_bit_mask/examples/test_dropout_gen_mask.cpp \| `std::vector<float> outHostData(8, 0);` \| 避免魔法数字 (8) \| 89 \| \| conversion/diag_v2/examples/test_geir_diag_v2.cpp \| `char endptr;` \| 使用std::string替代char* \| 220 \| \| random/dsa_gen_bit_mask/examples/test_dropout_gen_mask.cpp \| `std::vector<uint8_t> maskOutHostData(16, 0);` \| 避免魔法数字 (16) \| 90 \| \| conversion/diag_v2/examples/test_geir_diag_v2.cpp \| `FILE *fp;` \| 变量应在使用时声明初始化 \| 177 \| \| conversion/diag_v2/examples/test_geir_diag_v2.cpp \| `add1.set_attr_##attrName(attrValue);` \| 宏定义无需分号 \| 63 \| \| conversion/diag_v2/examples/test_geir_diag_v2.cpp \| `inputs.push_back(placeholder##intputIndex);` \| 宏定义无需分号 \| 60 \| \| conversion/diag_v2/examples/test_geir_diag_v2.cpp \| `add1.update_output_desc_##outputName(outputName##outputIndex##_desc);` \| 宏定义无需分号 \| 92 \| \| conversion/unfold_grad/op_kernel/unfold_grad_final_axe_big_size.h \| _(空行)_ \| 代码块末尾不应有空行 \| 56 \| \| random/dsa_gen_bit_mask/examples/test_aclnn_dropout_gen_mask_v2_tensor.cpp \| `std::vector<uint8_t> outHostData(16, 0);` \| 避免魔法数字 (16) \| 93 \| \| random/dsa_gen_bit_mask/examples/test_dropout.cpp \| `std::vector<uint8_t> maskOutHostData(16, 0);` \| 避免魔法数字 (16) \| 90 \| \| random/dsa_gen_bit_mask/examples/test_dropout.cpp \| `std::vector<float> outHostData(8, 0);` \| 避免魔法数字 (8) \| 89 \| \| conversion/concat_dv2/op_host/concat_dv2_def.cpp \| `0` \| 代码块末尾不应有空行 \| 45 \| \| conversion/concat_d/op_api/aclnn_cat.cpp \| `catMaxInputs = 512;` \| 避免魔法数字 (512) \| 337 \| \| conversion/clip_by_value_v2/examples/test_aclnn_clamp_max.cpp \| `std::vector<int8_t> outHostData(8, 0);` \| 避免魔法数字 (8) \| 80 \| \| random/dsa_gen_bit_mask/examples/test_dropout_gen_mask_v2.cpp \| `std::vector<uint8_t> outHostData(16, 0);` \| 避免魔法数字 (16) \| 86 \| \| conversion/broadcast_to/examples/test_geir_broadcast_to.cpp \| `inputs.push_back(placeholder##intputIndex);` \| 宏定义无需分号 \| 89 \| \| random/dsa_gen_bit_mask/examples/test_aclnn_bernoulli.cpp \| `std::vector<float> outHostData(16, 0);` \| 避免魔法数字 (16) \| 89 \| \| conversion/confusion_transpose_d/examples/test_aclnn_confusion_transpose.cpp \| `std::vector<float> outHostData(8, 1);` \| 避免魔法数字 (8) \| 116 \| \| conversion/clip_by_value_v2/examples/test_aclnn_clamp_max_tensor.cpp \| `std::vector<double> outHostData(8, 0);` \| 避免魔法数字 (8) \| 82 \| ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x] 其他，请描述：清理代码，优化代码风格。 See merge request: cann/ops-math!1295	3 个月前
op_host	fix unroll Co-authored-by: zhaozi3<zhaozi3@h-partners.com> # message auto-generated for no-merge-commit merge: !3045 merge master into master fix unroll Created-by: zhaozi3 Commit-by: zhaozi3 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> random_common中get_unroll影响其他算子，改为前置处理 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 泛化用例测试通过 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [x] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!3045	2 天前
op_kernel	新算子StatelessUniform+修改aclnnInplaceUniform、aclnnInplaceUniformTensor接口适配新算子 Co-authored-by: huairuchen<chenhuairu@huawei.com> # message auto-generated for no-merge-commit merge: !2828 merge pr_uni_nor into master 新算子StatelessUniform+修改aclnnInplaceUniform、aclnnInplaceUniformTensor接口适配新算子 Created-by: huairuchen Commit-by: huairuchen Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 修改aclnnInplaceUniform、aclnnInplaceUniformTensor接口，使这些接口可以在A5芯片不同分支下正确调用新算子StatelessUniform。保证精度正常 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> https://gitcode.com/cann/ops-math/issues/1722 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> 进行了静态检查二级冒烟构建触发 UT测试泛化ST测试跑了ttk xrun测试已测试测试两个aclnn接口单算子 geir图验证 pta验证 ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> 创建random\stateless_uniform\README.md 更新random\dsa_random_uniform\docs\aclnnInplaceUniform.md 更新random\dsa_random_uniform\docs\aclnnInplaceUniformTensor.md ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他，请描述： See merge request: cann/ops-math!2828	3 天前
CMakeLists.txt	随机数算子重构优化 Co-authored-by: fenglin28<fenglin28@huawei.com> # message auto-generated for no-merge-commit merge: !949 merge hh into master 随机数算子重构优化 Created-by: guankarl Commit-by: fenglin28 Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动，包括改动的原因和所采取的方法。--> 随机数算子重构优化，使用统一模板实现。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue，请在这里提供Issue链接。--> https://gitcode.com/cann/ops-math/issues/552 <!-- 如果这个PR是为了解决特定的问题单，请在这里描述问题单单号。--> ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ## 文档更新 <!--如果这个PR包含文档的更新，请在这里指出。例如：更新了README.md文件。--> ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [ ] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [x ] 其他，请描述：随机数算子重构，总共分为 5 个部分：算子infershape/inferdtype 实现了公共逻辑提取CommonInferShape，不同算子根据算子原型配置对应mode，新算子开发10行代码搞定示例： static graphStatus InferShapeRandomUniformV2(gert::InferShapeContext* context) { const std::unordered_map<std::string, size_t>& input_map = { {"shape", RANDOM_UNIFORM_V2_X}, {"offset", RANDOM_UNIFORM_V2_OFFSET}}; const std::unordered_map<std::string, size_t>& output_map = { {"y", RANDOM_UNIFORM_V2_Y}, {"offset", RANDOM_UNIFORM_V2_OFFSET}}; int32_t mode = RANDOM_UNIFORM_V2_MODE_TYPE; return ops::common::CommonInferShape(context, input_map, output_map, mode); } IMPL_OP_INFERSHAPE(RandomUniformV2).InferShape(InferShapeRandomUniformV2); 算子信息库注册def 算子的不同输入如果有多组dtype时候，在算子信息库的枚举中，可能会有几十种组合，手写容易漏掉或者重复，且不好检查，通过提供RandomDtypeFmtGen类，调用对应接口即可获取全部组合类型。示例： gen.GetSequence("inOutType") this->Input("x") .ParamType(REQUIRED) .DataType({gen.GetSequence("inOutType")}) .Format({baseFormatSeq}) .UnknownShapeFormat({baseFormatSeq}); 融合规则有状态算子转无状态算子，存在范式的融合规则，通过提取公共类，定义公共接口，后续类似融合规则无需重新开发，直接调用对应接口即可。 class FusionRandomUtils { public: FusionRandomUtils() = default; ~FusionRandomUtils() = default; // FusionRandomUtils(const FusionRandomUtils&) = delete; // FusionRandomUtils& operator=(const FusionRandomUtils&) = delete; /** * @param graph 计算图对象 * @param opDesc 算子描述指针 * @param offsetNode 输出：创建的offset Variable节点 * @param shapeDesc Shape输入的Tensor描述 * @param outputDesc 主输出Y的Tensor描述 * @param opNode 基准算子节点（用于拼接新节点名） * @param fusionPassName 日志标识（用于日志溯源） * @param fusedOpType 融合算子类型（用于日志/错误信息溯源） * @return Status SUCCESS/FAILED/PARAM_INVALID / static bool CheckSocVersion(const std::string& fusedOpType); static Status AddVariableNode( ge::ComputeGraph& graph, ge::NodePtr opNode, const ge::GeTensorDesc& offsetDesc, ge::NodePtr& newNode, const uint8_t dataPtr, size_t size, const std::string& fusionPassName); static Status CreateInputOpDesc( ge::OpDescPtr& opDesc, ge::GeTensorDesc shapeDesc, ge::GeTensorDesc offsetDesc, const std::string& fusedOpType); static Status CreateOutputOpDesc( ge::OpDescPtr& opDesc, ge::GeTensorDesc outputDesc, ge::GeTensorDesc offsetDesc, const std::string& fusedOpType); static Status AddOpNodeAndDesc(ge::ComputeGraph& graph, ge::OpDescPtr& opDesc, ge::NodePtr& offsetNode, ge::GeTensorDesc shapeDesc, ge::GeTensorDesc outputDesc, ge::NodePtr opNode, const std::string& fusionPassName, const std::string& fusedOpType); static Status UpdateAttr(ge::NodePtr opNode, int64_t seed, int64_t seed2, ge::DataType dtype, const std::string& fusionPassName, const std::string& fusedOpType); static Status CreateNode(ge::ComputeGraph& graph, ge::NodePtr opNode, std::vector<ge::NodePtr>& fusionNodes, ge::NodePtr& opV2Node, const std::string& fusionPassName, const std::string& fusedOpType, const std::set<ge::DataType> aicoreDtypeSupportList); static Status RemoveNode(ge::NodePtr node, ge::ComputeGraph& graph, const std::string& fusedOpType); static Status ReplaceNode(ge::NodePtr oldNode, ge::NodePtr newNode, ge::ComputeGraph& graph, const std::string& fusedOpType, const std::string& fusionPassName); }; 算子tiling 抽象并统一流程，更加适合随机数算子，统一tilingData，按照配置做检查。统一流程： ge::graphStatus RandomTilingArch35::DoTiling() { opName_ = context_->GetNodeName(); OP_LOGD(opName_, "Start tiling for op: %s", opName_.c_str()); // 步骤1：校验输入输出和属性 auto ret = CheckInputsOutputsAndAttrs(); if (ret != ge::GRAPH_SUCCESS) { OP_LOGE(opName_, "Check inputs/outputs/attrs failed"); return ret; } // 步骤2：获取硬件信息 ret = GetPlatformInfo(); if (ret != ge::GRAPH_SUCCESS) { OP_LOGE(opName_, "Get platform info failed"); return ret; } // 步骤3：填充TilingData ret = FillUnifiedTilingData(); if (ret != ge::GRAPH_SUCCESS) { OP_LOGE(opName_, "Fill tiling data failed"); return ret; } // 步骤4：计算tilingKey和workspace ret = CalcTilingKeyAndWorkspace(); if (ret != ge::GRAPH_SUCCESS) { OP_LOGE(opName_, "Calc tiling key/workspace failed"); return ret; } // 步骤5：后置处理（可选） ret = UniqueProcess(); if (ret != ge::GRAPH_SUCCESS) { OP_LOGE(opName_, "Unique process failed"); return ret; } // 步骤6：写入context ret = WriteBackToContext(); if (ret != ge::GRAPH_SUCCESS) { OP_LOGE(opName_, "Write tiling data to context failed"); return ret; } // 步骤7：调用dump函数 auto info = tilingData_.DumpTilingInfo(); OP_LOGI("RandomTiling", "%s", info.str().c_str()); OP_LOGD(opName_, "Tiling success for op: %s", opName_); return ge::GRAPH_SUCCESS; } 统一tilingData int64_t usedCoreNum = 0; int64_t normalCoreProNum = 0; int64_t tailCoreProNum = 0; int64_t singleBufferSize = 0; uint32_t key[2] = {0}; uint32_t counter[4] = {0}; int64_t outputSize = 0; int64_t probTensorSize = 0; int64_t sharedTmpBufSize = 0; 当前tilingData较少，后续如有需要，按需添加按照配置做检查： OpTilingConfig config; config.inputCheckRules = { // 输入索引: dtype列表，shapeSize，dim_num {0, {{ge::DT_INT32, ge::DT_INT64}, -1, {1}, nullptr}}, // shape {1, {{ge::DT_INT64}, 1, {}, nullptr}}, // offset }; config.outputCheckRules = { // 输出索引: dtype列表，shapeSize，dim_num {0, {{ge::DT_FLOAT, ge::DT_FLOAT16, ge::DT_BF16}, -1, {1,2,3,4,5,6,7,8}, nullptr}} }; // y 算子kernel kernel抽取了RandomKernelBaseOp类，专门管理tilingData，内置了Skip函数和生成随机数函数，其他算子只需调用VarsInit接口即可 See merge request: cann/ops-math!949	3 个月前