文件最后提交记录最后更新时间
【refactor】: 替换runtime/rts下接口为aclrt接口或仓间接口 Co-authored-by: kantao1<kantao1@huawei.com> # message auto-generated for no-merge-commit merge: !3080 merge instead_rts_interface into develop 【refactor】: 替换runtime/rts下接口为aclrt接口或仓间接口 Created-by: kantao1 Commit-by: kantao1 Merged-by: cann-robot Description: # Pull Request ## 描述 **rt/rts接口目录说明** 背景:pkg_inc/runtime/runtime 目录下的接口,**630** 后会添加编译告警,**1230** 后会删除。 ``` # toolkit 包里头文件目录结构 xxx/Ascend/cann/x86_64-linux/pkg_inc/runtime - rt_external.h - runtime/ --- 后续删除的目录 - rt.h - rts/ - rts.h ``` **接口替换方案** ```mermaid flowchart LR A[优先使用 aclrt] B[使用仓间接口rt_external.h] C[需要咨询runtime] A -->|没有| B -->|没有| C ``` <br/> **主要变更内容:** 1. 接口替换 - rtsGetThreadLastTaskId --> aclrtGetThreadLastTaskId 2. 移除 rts 打桩接口 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [x] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1. 编译 GE 项目:bash build.sh --ge_executor 2. 运行 UT 测试:bash tests/run_test.sh -u ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 **遗留事项:** 1. 打桩符号 rtsGetThreadLastTaskId 后续移除,当前engines组件有调用 2. 后续用 rtGetDeviceCapability 替换 rtsDeviceGetCapability,当前仓间缺少 rtGetDeviceCapability 3. 待rt.h的全部移除后,再用rt_external.h替换rts.h,因为当前替换的话,会引起很多符号的歧义问题(rt_external.h 与 rt.h 中有重复定义符号) 这些放到下一单中修改。 See merge request: cann/ge!30805 天前
【PR】: 调整ge中libops_host_cpu.so加载顺序 Co-authored-by: jikai-tyler<jikai5@huawei.com> # message auto-generated for no-merge-commit merge: !3268 merge ge_so into develop 【PR】: 调整ge中libops_host_cpu.so加载顺序 Created-by: jikai-tyler Commit-by: jikai-tyler Merged-by: cann-robot Description: # Pull Request ## 描述 libops_host_cpu.so中include了all_ops.h头文件,会注册原型,先加载libops_host_cpu.so后加载开源so算子会导致开源仓算子修改不生效。 修改方案:将libops_host_cpu.so加载顺序调整到与legacy.so一起,放到开源仓so后面加载 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.验证so加载场景 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!32681 天前
refactor: 删除ge_rts_decl.h中与rt_external重复的定义 Co-authored-by: tangqunzhang<tangqunzhang@huawei.com> # message auto-generated for no-merge-commit merge: !3303 merge refactor/remove-duplicate-rt-decls into develop refactor: 删除ge_rts_decl.h中与rt_external重复的定义 Created-by: tangqunzhang Commit-by: tangqunzhang Merged-by: cann-robot Description: # Pull Request ## 描述 删除ge_rts_decl.h中与rt_external头文件重复的定义,避免重复声明。 ## 变更内容 - 删除rtDevBinary_t结构体(已在rt_external_kernel.h中定义) - 删除rtDevBinaryRegister函数声明(已在rt_external_kernel.h中定义) - 删除rtRegisterAllKernel函数声明(已在rt_external_kernel.h中定义) - tbe_kernel_handle.h改为直接include runtime/rt.h ## 变更类型 - [ ] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新 - [x] ♻️ 重构 - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 核对清单 - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [ ] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签 See merge request: cann/ge!33031 天前
refactor: runtime/v1 消除非开放runtime头文件依赖,替换为开放头文件+ge_rts_decl.h Co-authored-by: tangqunzhang<tangqunzhang@huawei.com> # message auto-generated for no-merge-commit merge: !3176 merge develop into develop refactor: runtime/v1 消除非开放runtime头文件依赖,替换为开放头文件+ge_rts_decl.h Created-by: tangqunzhang Commit-by: tangqunzhang Merged-by: cann-robot Description: # Pull Request ## 描述 消除 runtime/v1/ 中对非开放 runtime/*.h 头文件的依赖,替换为开放头文件(rt_external*.h)+ ge_rts_decl.h(自行声明)。主要变更: 1. **新增 base/common/ge_rts_decl.h**:自行声明不在开放头文件中的 rt 类型(rtDevBinary_t、rtFunctionInfo_t、rtKernelDetailInfo_t、rtMemRequestFeature_t)和函数(rtKernelLaunchWithHandleV2、rtKernelLaunchWithFlagV2、rtKernelLaunchEx、rtKernelLaunchFwk、rtAicpuKernelLaunchWithFlag、rtDevBinaryRegister、rtDevBinaryUnRegister、rtRegisterAllKernel、rtMetadataRegister、rtFunctionRegister、rtGetFunctionByName、rtKernelGetAddrAndPrefCntV2、rtGetTsMemType),受 #ifndef CCE_RUNTIME_KERNEL_H#ifndef CCE_RUNTIME_DEVICE_H guard 保护避免重复定义 2. **非开放头文件替换**:9个 .h 文件移除 runtime/rt.h 替换为开放头文件或 ge_rts_decl.hruntime_api_wrapper.h 移除 runtime/rt_ffts_plus.hruntime/rt_stars.hruntime/mem.h 3. **非开放 rt 函数替换为 aclrt 等价接口**: - rtStreamSynchronizeWithTimeout → aclrtSynchronizeStreamWithTimeout(5处) - rtStreamWaitEvent → aclrtStreamWaitEvent - rtStreamWaitEventWithTimeout → aclrtStreamWaitEventWithTimeout - rtMemset → aclrtMemset - rtMemcpyAsync → aclrtMemcpyAsync(7处) - RT_MEMCPY_* → ACL_MEMCPY_* 枚举 - RT_MEMCPY_HOST_TO_DEVICE_EX → ACL_MEMCPY_HOST_TO_BUF_TO_DEVICE - rtCtxGetCurrent → aclrtGetCurrentContext - rtContext_t → aclrtContext - rts_node_executor.h: tagRtMemcpyKind → aclrtMemcpyKind ## 变更类型 - [x] ♻️ 重构(既不修复错误也不增加功能的代码变动) ## 如何测试 1. 编译 runtime/v1 相关模块,确认无编译错误 2. 运行 kernel_handle_unittest、kernel_task_info_unittest 等 UT 3. 确认无开放/非开放头文件 struct tag 重复定义冲突 ## 核对清单 - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我在标题中使用了合适的类型标签(如:refactor:) See merge request: cann/ge!31764 天前
【PR】: fix coredump in OpsKernelExecutorManager Co-authored-by: jiming<wangjiming5@huawei.com> # message auto-generated for no-merge-commit merge: !2358 merge feature into develop 【PR】: fix coredump in OpsKernelExecutorManager Created-by: gcw_3CxwvBIO Commit-by: jiming Merged-by: cann-robot Description: # Pull Request ## 描述 OpsKernelExecutorManager持有hccl so的智能指针,如果所在so的释放在hccl so释放之后,会存在coredump问题 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug 修复 - [ ] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 ge_cache场景开hccl功能可复现 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 在此添加任何其他关于本次 PR 的说明。 See merge request: cann/ge!23581 个月前
refactor: runtime/v1 消除非开放runtime头文件依赖,替换为开放头文件+ge_rts_decl.h Co-authored-by: tangqunzhang<tangqunzhang@huawei.com> # message auto-generated for no-merge-commit merge: !3176 merge develop into develop refactor: runtime/v1 消除非开放runtime头文件依赖,替换为开放头文件+ge_rts_decl.h Created-by: tangqunzhang Commit-by: tangqunzhang Merged-by: cann-robot Description: # Pull Request ## 描述 消除 runtime/v1/ 中对非开放 runtime/*.h 头文件的依赖,替换为开放头文件(rt_external*.h)+ ge_rts_decl.h(自行声明)。主要变更: 1. **新增 base/common/ge_rts_decl.h**:自行声明不在开放头文件中的 rt 类型(rtDevBinary_t、rtFunctionInfo_t、rtKernelDetailInfo_t、rtMemRequestFeature_t)和函数(rtKernelLaunchWithHandleV2、rtKernelLaunchWithFlagV2、rtKernelLaunchEx、rtKernelLaunchFwk、rtAicpuKernelLaunchWithFlag、rtDevBinaryRegister、rtDevBinaryUnRegister、rtRegisterAllKernel、rtMetadataRegister、rtFunctionRegister、rtGetFunctionByName、rtKernelGetAddrAndPrefCntV2、rtGetTsMemType),受 #ifndef CCE_RUNTIME_KERNEL_H#ifndef CCE_RUNTIME_DEVICE_H guard 保护避免重复定义 2. **非开放头文件替换**:9个 .h 文件移除 runtime/rt.h 替换为开放头文件或 ge_rts_decl.hruntime_api_wrapper.h 移除 runtime/rt_ffts_plus.hruntime/rt_stars.hruntime/mem.h 3. **非开放 rt 函数替换为 aclrt 等价接口**: - rtStreamSynchronizeWithTimeout → aclrtSynchronizeStreamWithTimeout(5处) - rtStreamWaitEvent → aclrtStreamWaitEvent - rtStreamWaitEventWithTimeout → aclrtStreamWaitEventWithTimeout - rtMemset → aclrtMemset - rtMemcpyAsync → aclrtMemcpyAsync(7处) - RT_MEMCPY_* → ACL_MEMCPY_* 枚举 - RT_MEMCPY_HOST_TO_DEVICE_EX → ACL_MEMCPY_HOST_TO_BUF_TO_DEVICE - rtCtxGetCurrent → aclrtGetCurrentContext - rtContext_t → aclrtContext - rts_node_executor.h: tagRtMemcpyKind → aclrtMemcpyKind ## 变更类型 - [x] ♻️ 重构(既不修复错误也不增加功能的代码变动) ## 如何测试 1. 编译 runtime/v1 相关模块,确认无编译错误 2. 运行 kernel_handle_unittest、kernel_task_info_unittest 等 UT 3. 确认无开放/非开放头文件 struct tag 重复定义冲突 ## 核对清单 - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我在标题中使用了合适的类型标签(如:refactor:) See merge request: cann/ge!31764 天前
【feat】:自定义算子入图支持地址刷新 Co-authored-by: yuht9<yuhaitao6@huawei.com> # message auto-generated for no-merge-commit merge: !3270 merge develop into develop 【feat】:自定义算子入图支持地址刷新 Created-by: yuht9 Commit-by: yuht9 Merged-by: cann-robot Description: # Pull Request ## 描述 新增接口与数据结构: - ArgsHandler: args 内存管理抽象接口(VA 分配 + H2D 拷贝) - KernelArgs: kernel launch arguments 结构体,含 placement 信息 - UpdateArgsContext: 地址刷新上下文,继承自 EagerOpExecutionContext - ArgsUpdater: 自定义算子地址刷新能力接口,算子继承后框架在 I/O 地址变化时回调 UpdateHostArgs - SinkOpArgsHandler: SinkOp 场景下 ArgsHandler 实现,委托 CustomTaskInfo 完成分配 - ArgsAllocationResult: 分配结果描述,含 reserved/extra 来源信息 - TaskInfo 新增 NeedReserveArgsTable/UpdateHostArgs/GetArgsAllocationResults 虚接口 CustomTaskInfo 扩展: - 支持 ArgsUpdater 算子检测(IsAddressRefreshable)及地址刷新策略 - MallocReadOnlyDevArgsImpl 双路径分配:reserved 段(支持刷新)/ 动态内存(H2D 直拷) - UpdateHostArgs 实现 I/O 地址更新及算子回调 - InitArgsIoAddrsUpdater 初始化地址映射关系 ModelArgsManager 扩展: - 三级内存分配:reserved segment -> existing extra pool -> new extra pool - IntegrateCustomOpArgs 将自定义算子 args 集成到统一刷新流程 - IntegrateReservedH2DCopyDatas/IntegrateExtraH2DCopyDatas 注册 H2D 刷新数据 - IntegrateReservedUpdateDatas/IntegrateExtraUpdateDatas 注册 host args 刷新数据 - UpdateCustomOpHostArgs/RefreshExtraH2DCopyDatas 执行阶段触发刷新 - custom_op_policies_to_task_infos_ 使用 unordered_set 保证去重 编译器适配: - block_mem_assigner: 自定义算子支持零拷贝(IsAddressRefreshable 动态判断) - mem_layout_conflict_util: 自定义算子支持地址刷新 CustomOpFactory 扩展: - IsAddressRefreshable: 通过 dynamic_cast 判断算子是否支持地址刷新 UT/ST 用例: - SinkOpArgsHandler/CustomTaskInfo/ModelArgsManager/ArgsIoAddrsUpdater/UpdateArgsContext/DavinciModel 单元测试 - 自定义算子地址刷新端到端 ST 用例及 CustomTaskInfo 地址刷新模式验证 - reserved+extra 去重验证、多个 ArgsUpdater 并发刷新测试 ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [ ] 🐛 Bug 修复 - [x] ✨ 新功能 - [ ] 💄 代码风格更新(格式化,局部变量) - [ ] ♻️ 重构(既不修复错误也不增加功能的代码变动) - [ ] 📦 构建过程或辅助工具的变动 - [ ] 📝 文档内容更新 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在当前页面的右侧'关联Issue'部分添加相应Issue链接,并勾选'合并后关闭已关联的 Issue'选项。 --> ## 如何测试 描述测试此变更的步骤和前提条件: 1.构造自定算子连接模型边界场景,算子实现UpdateHostArgs函数,模型执行精度正确。 ## 核对清单 <!-- [x] 表示选中 --> - [x] 我的代码遵循了项目的代码风格 - [x] 我已对代码进行了自测 - [x] 我已更新了相关的文档 - [x] 我在标题中使用了合适的类型标签(如:feat:, fix:) - [x] 我已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 ## 其他信息 20260423评审通过 See merge request: cann/ge!32701 天前