文件最后提交记录最后更新时间
【PR】fix: 修复OM2 DataDump step_id_addr为空 Co-authored-by: Renzhi Xiang<xiangrenzhi@huawei.com> # message auto-generated for no-merge-commit merge: !3011 merge fix_om2_step_id_addr into develop 【PR】fix: 修复OM2 DataDump step_id_addr为空 Created-by: xiangrenzhi Commit-by: Renzhi Xiang Merged-by: cann-robot Description: # Pull Request ## 描述 修复OM2 DataDump step_id_addr为空 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.在om2场景下开启datadump,检查生成的dump路径下是否有data_index这一层级的目录生成 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!301112 天前
Initial commit 5 个月前
refactor: runtime/v1 消除非开放runtime头文件依赖,替换为开放头文件+ge_rts_decl.h Co-authored-by: tangqunzhang<tangqunzhang@huawei.com> # message auto-generated for no-merge-commit merge: !3176 merge develop into develop refactor: runtime/v1 消除非开放runtime头文件依赖,替换为开放头文件+ge_rts_decl.h Created-by: tangqunzhang Commit-by: tangqunzhang Merged-by: cann-robot Description: # Pull Request ## 描述 消除 runtime/v1/ 中对非开放 runtime/*.h 头文件的依赖,替换为开放头文件(rt_external*.h)+ ge_rts_decl.h(自行声明)。主要变更: 1. **新增 base/common/ge_rts_decl.h**:自行声明不在开放头文件中的 rt 类型(rtDevBinary_t、rtFunctionInfo_t、rtKernelDetailInfo_t、rtMemRequestFeature_t)和函数(rtKernelLaunchWithHandleV2、rtKernelLaunchWithFlagV2、rtKernelLaunchEx、rtKernelLaunchFwk、rtAicpuKernelLaunchWithFlag、rtDevBinaryRegister、rtDevBinaryUnRegister、rtRegisterAllKernel、rtMetadataRegister、rtFunctionRegister、rtGetFunctionByName、rtKernelGetAddrAndPrefCntV2、rtGetTsMemType),受 #ifndef CCE_RUNTIME_KERNEL_H#ifndef CCE_RUNTIME_DEVICE_H guard 保护避免重复定义 2. **非开放头文件替换**:9个 .h 文件移除 runtime/rt.h 替换为开放头文件或 ge_rts_decl.hruntime_api_wrapper.h 移除 runtime/rt_ffts_plus.hruntime/rt_stars.hruntime/mem.h 3. **非开放 rt 函数替换为 aclrt 等价接口**: - rtStreamSynchronizeWithTimeout → aclrtSynchronizeStreamWithTimeout(5处) - rtStreamWaitEvent → aclrtStreamWaitEvent - rtStreamWaitEventWithTimeout → aclrtStreamWaitEventWithTimeout - rtMemset → aclrtMemset - rtMemcpyAsync → aclrtMemcpyAsync(7处) - RT_MEMCPY_* → ACL_MEMCPY_* 枚举 - RT_MEMCPY_HOST_TO_DEVICE_EX → ACL_MEMCPY_HOST_TO_BUF_TO_DEVICE - rtCtxGetCurrent → aclrtGetCurrentContext - rtContext_t → aclrtContext - rts_node_executor.h: tagRtMemcpyKind → aclrtMemcpyKind ## 变更类型 - [x] ♻️ 重构(既不修复错误也不增加功能的代码变动) ## 如何测试 1. 编译 runtime/v1 相关模块,确认无编译错误 2. 运行 kernel_handle_unittest、kernel_task_info_unittest 等 UT 3. 确认无开放/非开放头文件 struct tag 重复定义冲突 ## 核对清单 - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我在标题中使用了合适的类型标签(如:refactor:) See merge request: cann/ge!31764 天前
【feat】:自定义算子入图支持地址刷新 Co-authored-by: yuht9<yuhaitao6@huawei.com> # message auto-generated for no-merge-commit merge: !3270 merge develop into develop 【feat】:自定义算子入图支持地址刷新 Created-by: yuht9 Commit-by: yuht9 Merged-by: cann-robot Description: # Pull Request ## 描述 新增接口与数据结构: - ArgsHandler: args 内存管理抽象接口(VA 分配 + H2D 拷贝) - KernelArgs: kernel launch arguments 结构体,含 placement 信息 - UpdateArgsContext: 地址刷新上下文,继承自 EagerOpExecutionContext - ArgsUpdater: 自定义算子地址刷新能力接口,算子继承后框架在 I/O 地址变化时回调 UpdateHostArgs - SinkOpArgsHandler: SinkOp 场景下 ArgsHandler 实现,委托 CustomTaskInfo 完成分配 - ArgsAllocationResult: 分配结果描述,含 reserved/extra 来源信息 - TaskInfo 新增 NeedReserveArgsTable/UpdateHostArgs/GetArgsAllocationResults 虚接口 CustomTaskInfo 扩展: - 支持 ArgsUpdater 算子检测(IsAddressRefreshable)及地址刷新策略 - MallocReadOnlyDevArgsImpl 双路径分配:reserved 段(支持刷新)/ 动态内存(H2D 直拷) - UpdateHostArgs 实现 I/O 地址更新及算子回调 - InitArgsIoAddrsUpdater 初始化地址映射关系 ModelArgsManager 扩展: - 三级内存分配:reserved segment -> existing extra pool -> new extra pool - IntegrateCustomOpArgs 将自定义算子 args 集成到统一刷新流程 - IntegrateReservedH2DCopyDatas/IntegrateExtraH2DCopyDatas 注册 H2D 刷新数据 - IntegrateReservedUpdateDatas/IntegrateExtraUpdateDatas 注册 host args 刷新数据 - UpdateCustomOpHostArgs/RefreshExtraH2DCopyDatas 执行阶段触发刷新 - custom_op_policies_to_task_infos_ 使用 unordered_set 保证去重 编译器适配: - block_mem_assigner: 自定义算子支持零拷贝(IsAddressRefreshable 动态判断) - mem_layout_conflict_util: 自定义算子支持地址刷新 CustomOpFactory 扩展: - IsAddressRefreshable: 通过 dynamic_cast 判断算子是否支持地址刷新 UT/ST 用例: - SinkOpArgsHandler/CustomTaskInfo/ModelArgsManager/ArgsIoAddrsUpdater/UpdateArgsContext/DavinciModel 单元测试 - 自定义算子地址刷新端到端 ST 用例及 CustomTaskInfo 地址刷新模式验证 - reserved+extra 去重验证、多个 ArgsUpdater 并发刷新测试 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.构造自定算子连接模型边界场景,算子实现UpdateHostArgs函数,模型执行精度正确。 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 20260423评审通过 See merge request: cann/ge!32701 天前
fix: 修复buildcheck问题 Co-authored-by: 叶龙剑<yelongjian1@huawei.com> # message auto-generated for no-merge-commit merge: !2333 merge dev-check0427 into develop fix: 修复buildcheck问题 Created-by: yelongjian Commit-by: 叶龙剑 Merged-by: cann-robot Description: # Pull Request ## 描述 修复buildcheck问题 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.NA ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!23331 个月前
【PR】clean code: function declares must have consistent parameter names Co-authored-by: wangyuchen<wangyuchen38@huawei.com> # message auto-generated for no-merge-commit merge: !1808 merge fix/clean_code into develop 【PR】clean code: function declares must have consistent parameter names Created-by: yuchen97 Commit-by: wangyuchen Merged-by: cann-robot Description: # Pull Request ## 描述 清理代码告警:函数原型声明与函数定义的的变量名及修饰符需要保持一致。 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [x] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!18081 个月前
Initial commit 5 个月前
Initial commit 5 个月前
【PR】:ge一月份需求合入(包含整改dflow ST、自定义算子执行Context等) Co-authored-by: jikai-tyler<jikai5@huawei.com> # message auto-generated for no-merge-commit merge: !223 merge master into master 【PR】:ge一月份需求合入(包含整改dflow ST、自定义算子执行Context等) Created-by: jikai-tyler Commit-by: jikai-tyler Merged-by: cann-robot Description: # Pull Request ## 描述 ge一月份需求合入: 1、llt测试用例相关重复stub文件清理 2、Triton入图parser解析dlopen的handle关闭 - Triton入图parser解析dlopen的handle关闭 - 补充tensorflow 中其他的入参类型 - 优化parser 解析的的代码 3、UserGraphsManager suppport gert::Tensor - UserGraphsManager及JitExecutor等RunGraphAsync入参由ge::Tensor改为gert::Tensor - 老的兼容接口Session::RunGraph/RunGraphAsync在ge_api.cc 将ge::Tensor转换为gert::Tensor,然后调用InnerSession的接口。 4、整改dflow ST中的HELPER_RES_FILE_PATH - HELPER_RES_FILE_PATH配置文件已经废弃,需要删除并整改用例使用RESOURCE_CONFIG_PATH。 - rtGetIsHeterogenous接口已经废弃,需要删除并整改用例使用RESOURCE_CONFIG_PATH环境变量。 5、注册ge错误码 - 从error_code.json文件中拆分出GE错误码,通过ErrorManager模块的对外接口REG_FORMAT_ERROR_MSG宏完成GE错误码的注册 6、使能acl目录覆盖率拦截项 7、triton入图parser解析优化 8、告警规则处理 9、refactor parser/common/tuple.h 10、fix UserGraphControl SetCompiledFlag/SetCompiledFlag 11、修复Sample问题 - Include stdint and stddef for base mdl - move CheckRunGraphMode to ge_api_v2.cc 12、自定义算子执行Context 13、fix AllRealInputsAreTheSameOutAnchor error log issue - 在Session::AddGraph时会造一个UserGraphControl实例。因此在UserGraphControl中增加compiled_flag 14、bugfix:handling excessively long name - 避免因字符串过长导致二进制匹配耗尽资源而coredump,裁剪name,只保留最开始的128字符 15、acl code check告警处理 16、modify 3rd compile para 17、修改自定义ES_API Sample问题 && README.md 18、Refined inner session to no longer retrieve GraphNode or GraphOptions via graph_id from graph_manager. 19、ES关键类PIMPL实现 && 修改命名空间 - EsCGraphBuilder, CompliantNodeBuilder, EsCTensorHolder改为PIMPL实现 - 修改AddEdgeAndUpdatePeerDesc和CompliantNodeBuilder命名空间至ge::es 20、手动实现log功能, 实现debug_print函数来定位 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.存量用例执行 2.告警规则检测 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!2233 个月前
Initial commit 5 个月前
Initial commit 5 个月前
【PR】:修改代码中不规范部分(注释,变量拼写等) Co-authored-by: chenqian1365<chenqian2@huawei.com> # message auto-generated for no-merge-commit merge: !3201 merge develop into develop 【PR】:修改代码中不规范部分(注释,变量拼写等) Created-by: chenqian1365 Commit-by: chenqian1365 Merged-by: cann-robot Description: # Pull Request ## 描述 修改代码中不规范部分(注释,变量拼写等) ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 不涉及 ## 核对清单 <!-- [x] 表示选中 --> - [ ] 我的代码遵循了项目的代码风格 - [ ] 我已对代码进行了自测 - [ ] 我已更新了相关的文档 - [ ] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [ ] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!32015 天前
【PR】: bundle share require Co-authored-by: tang-haojie<tanghaojie1@huawei.com> # message auto-generated for no-merge-commit merge: !214 merge master into master 【PR】: bundle share require Created-by: tang-haojie Commit-by: tang-haojie Merged-by: cann-robot Description: # Pull Request ## 描述 支持bundle模型多实例共享权重需求,具体修改如下: 1、将BUNDLE_MODEL_VAR_INFO信息打包到bundle om中 2、支持传入variable内存,由外部申请释放,这种情况下,直接按偏移取地址,内部不再申请。 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [ ] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [ ] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!2144 个月前
【PR】: OPTION_OUTPUT_REUSE_INPUT_MEM_INDEXES option增加到校验白名单 Co-authored-by: KenChow<zhouchen53@huawei.com> # message auto-generated for no-merge-commit merge: !301 merge dev_to_community_master into master 【PR】: OPTION_OUTPUT_REUSE_INPUT_MEM_INDEXES option增加到校验白名单 Created-by: KenChow Commit-by: ZhouChen;KenChow Merged-by: cann-robot Description: # Pull Request ## 描述 1.TensorMove优化新增执行期对于输入输出内存地址复用场景的地址校验 2.新增图级别option:OPTION_OUTPUT_REUSE_INPUT_MEM_INDEXES,且支持IR构图使用,将option增加到校验白名单,避免warning告警该option不支持 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.构造输入为Data、满足TensorMove可以被消除的场景用例 2.TorchAir/IR入口构造输入和输出内存复用场景 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!3013 个月前
【feat】: rt接口切换为aclrt系列接口-notify相关 Co-authored-by: wuzhengzhen<wuzhengzhen@huawei.com> # message auto-generated for no-merge-commit merge: !1147 merge aclrt_notify_test into develop 【feat】: rt接口切换为aclrt系列接口-notify相关 Created-by: wuzhengzhen Commit-by: wuzhengzhen Merged-by: cann-robot Description: # Pull Request ## 描述 请清晰准确地描述本次 Pull Request 的意图和变更内容。 修改以下notfiy相关的rt接口 rtNotifyCreate/rtNotifyCreateWithFlag -> aclrtCreateNotify rtNotifyDestroy -> aclrtDestroyNotify rtNotifyRecord -> aclrtRecordNotify rtNotifyWait/rtNotifyWaitWithTimeout -> aclrtWaitAndResetNotify ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [x] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!11472 个月前
【feat】: acl_mdl 模块支持 OM2 Co-authored-by: likun104<likun104@h-partners.com> Co-authored-by: wuzheng-hw<wuzheng14@huawei.com> # message auto-generated for no-merge-commit merge: !2687 merge acl_adapt_and_so_0506_backup into develop 【feat】: acl_mdl 模块支持 OM2 Created-by: wuzheng-hw Commit-by: wuzheng-hw;likun104 Merged-by: cann-robot Description: ## 描述 本PR实现了acl_mdl模块对OM2格式的完整支持,包括OM和OM2的解耦、核心接口适配、资源管理器拆分、TensorDesc解耦、AIPP支持和modena形态桩so生成。 ## 变更类型 - [x] ✨ 新功能 - [x] ♻️ 重构(OM和OM2解耦) - [x] 📦 构建过程或辅助工具的变动 ## 核心改动 ### 1. OM和OM2解耦 - 拆分libacl_mdl_impl.so为OM专属实现 - 新增libacl_mdl_impl_v2.so用于OM2实现 - AclResourceManager拆分为OM和OM2两个版本 - 移除OM对om2_executor的直接依赖 ### 2. 核心接口OM2适配 - aclmdlLoadFromFile/Unload: 支持OM2模型加载卸载 - aclmdlExecute/ExecuteAsync: 支持OM2模型执行 - aclmdlGetDesc: 支持OM2模型描述获取 - aclmdlQuerySize: 支持OM2模型大小查询 - aclmdlGetDescFromFile/Mem: 支持OM2模型预加载描述获取 ### 3. TensorDesc依赖解耦 - 新增Om2TensorDesc独立实现,不依赖GE图库 - GeTensorDesc保留在OM路径 ### 4. OM2 AIPP支持 - 新增acl_aipp_om2.cpp实现OM2 AIPP操作 - 支持aclmdlGetAippType/GetFirstAippInfo/SetInputAIPP等接口 ### 5. modena形态桩so支持 - 新增gen_stubapi_acl_mdl_impl.py脚本生成桩文件 - 桩so包含acl_mdl.h和acl_base_mdl.h的所有接口 - modena形态可用桩so替代真实impl.so,节省内存 ### 6. 新增测试用例 - acl_resource_manager_om2_unittest.cpp: 资源管理器测试 - om2_model_executor_unittest.cc: 执行器测试 - om2_package_helper_unittest.cc: 包管理工具测试 - test_om2.cc: 系统集成测试 ## 文件变更统计 - 45个文件变更 - 7223行新增 - 2325行删除 ## 核对清单 - [x] 代码遵循项目的代码风格 - [x] 已对代码进行了自测 - [x] 已更新了相关的文档 - [x] 使用了合适的类型标签(feat:) - [x] 已详细阅读了贡献指南 ## 其他信息 本次改动基于设计文档:/home/wuzheng/workspace/om2_docs/apis/acl_mdl模块支持OM2需求设计.md 主要实现了设计文档中的以下需求: 1. acl_mdl.h和acl_base_mdl.h接口OM2适配分析 2. OM和OM2解耦需求分析 3. modena形态编译打包适配 See merge request: cann/ge!268721 天前
【PR】:补充om2 overflow dump和l1 exception dump能力 Co-authored-by: Renzhi Xiang<xiangrenzhi@huawei.com> # message auto-generated for no-merge-commit merge: !2864 merge develop_om2_dump_5 into develop 【PR】:补充om2 overflow dump和l1 exception dump能力 Created-by: xiangrenzhi Commit-by: Renzhi Xiang Merged-by: cann-robot Description: # Pull Request ## 描述 补充om2 overflow dump和l1 exception dump能力 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.在Om2场景开启 overflow dump验证是否dump出溢出的算子文件 2.在Om2场景开启 l1 exception dump验证是否dump出发生aic error的算子文件 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!286419 天前
【PR】: bundle require bug fix Co-authored-by: tang-haojie<tanghaojie1@huawei.com> # message auto-generated for no-merge-commit merge: !216 merge master into master 【PR】: bundle require bug fix Created-by: tang-haojie Commit-by: tang-haojie Merged-by: cann-robot Description: # Pull Request ## 描述 add varweight verify aclmdlBundleInitXX接口支持外部传入可刷新权重内存,需要增加大小的校验,不能比模型需要的小,小了需要报错 bundle build bug fix RemoveNodeWithoutRelink删除节点的入参应该是该节点所在的图,而不应该是主图。 optimize aclGetCustomOpLibPath process 自定义算子工程交付分为run包交付和so交付两种形式,在so交付的形式下,入图场景在调用ge初始化后可以通过aclGetCustomOpLibPath 获取入图场景下自定义算子的路径。即aclGetCustomOpLibPath的获取依赖先调用GE初始化。当前tfa场景存在先调用该接口,后调用GE初始化的流程,会造成该接口获取的自定义算子路径为空。 aclGetCustomOpLibPath 里面判断有没有进行过自定义算子路径获取,如果没有处理过,则调用下获取流程,保证获取路径正确。 add rtsession destroy resource api 离线场景下,静态动态模型卸载时会根据执行器的session_id去卸载相应session级别的资源。如果一个执行器model_id跟session_id是一一对应的,则卸载时候去释放session级别的资源没有问题。但在bundlemodel的场景下,多个模型执行器是共享同一个RtSession的,即多个model_id是对应一个session_id,session级的资源是共享的,单独卸载某个模型的时候不应该触发session级别资源的释放,否则会影响其他模型的执行。 离线场景下session_id有两种,一种是加载时候自己生成的,一种是入参RtSession传下来的。前者这种跟模型是一一对应的,卸载的时候释放session级别的资源没问题。如果是入参传的,证明可能跟其他模型共享同一份session资源。这种场景下单个模型卸载就不释放session级资源,提供RtSession的DestroyResources接口交由调用方去释放,类比在线场景下innersession的释放。 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [x] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [ ] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [ ] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!2164 个月前
Initial commit 5 个月前
【PR】clean code: function declares must have consistent parameter names Co-authored-by: wangyuchen<wangyuchen38@huawei.com> # message auto-generated for no-merge-commit merge: !1808 merge fix/clean_code into develop 【PR】clean code: function declares must have consistent parameter names Created-by: yuchen97 Commit-by: wangyuchen Merged-by: cann-robot Description: # Pull Request ## 描述 清理代码告警:函数原型声明与函数定义的的变量名及修饰符需要保持一致。 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [x] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!18081 个月前
【feat】: rt接口切换为aclrt系列接口4--stream类接口 无withConfig接口 Co-authored-by: maohaodi<maohaodi@huawei.com> # message auto-generated for no-merge-commit merge: !1376 merge aclrt_api_stream_without_flag into develop 【feat】: rt接口切换为aclrt系列接口4--stream类接口 无withConfig接口 Created-by: maohaodi Commit-by: maohaodi Merged-by: cann-robot Description: # Pull Request ## 描述 rt接口切换为aclrt系列接口。stream类接口,切换的接口列表如下: rtStreamCreate -> aclrtCreateStream rtStreamDestroyForce -> aclrtDestroyStreamForce rtStreamDestroy -> aclrtDestroyStream rtGetAvailStreamNum -> aclrtGetStreamAvailableNum rtsStreamGetId -> aclrtStreamGetId rtStreamSynchronize -> aclrtSynchronizeStream rtStreamActive -> aclrtActiveStream rtStreamTaskClean -> aclrtPersistentTaskClean ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [x] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 2. ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!13762 个月前