| [fix]GetRemoteMems Co-authored-by: renyumin<renyumin1@huawei.com> # message auto-generated for no-merge-commit merge: !2253 merge master into master [fix]GetRemoteMems Created-by: renyumin Commit-by: renyumin Merged-by: cann-robot Description: ## 描述 MyRank::ChannelGetHcclBuffer 接口中存在将 vector 大小写死的临时方案,已知在 GE 图模式场景内存数量过多的情况下会导致 coredump,现整改如下: 1. 将 MyRank::ChannelGetHcclBuffer 和 MyRank::ChannelGetRemoteMems 后续调用接口归一,在 MyRank 中对底层返回的内存信息进行筛选; 2. 因当前创建 channel 时传入的 memHandles 转换为的 buffer 指针可拿到符合预期的 memTag,不再需要另外使用成员存储 memTag,清除 channel 和 transport 内冗余的对 tag 信息的存储和交换,需要 tag 信息的位置通过 buffer 指针获取,因当前各场景均可通过 buffer 指针获取内存信息,底层实现归一并删除冗余代码; 3. 因除集合通信层,各处并不将 memTag 作为内存索引使用,现将 HcommChannelGetRemoteMems 向下涉及的成员及函数名修改为 memInfo; 4. 除对外接口调整 ChannelGetRemoteMems 相关接口出参顺序,将较为重要的 memNum 移至出参第一项; ## 变更类型 请选择本次引入的变更类型: <!-- [x] 表示选中 --> - [x] 🐛 Bug修复 - [ ] ✨ 新特性 - [ ] 🚀 性能优化 - [ ] 📝 文档更新 - [ ] 📋 其他,请描述: ## 关联的Issue DTS2026042919531 ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于构造对应xx测试用例、二级冒烟、算子泛化等。--> 已完成的测试用例和场景: 1. HcclChannelGetRemoteMems 当前仅在图模式或单算子 AIV 场景使用,均已自测部分用例确认日志表现行为符合预期; 2. 全量 RDV 除已知问题用例均已手跑通过; 补充的UT用例:整改前接口已有用例覆盖,修改后复用已有用例 ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> ## 合入检查 <!-- 在正式合入前,请做好必要的代码测试,用例补充,软件代码风格检查等。提高合入效率。--> <!-- [x] 表示选中 --> - [x] 🧐 已经详细阅读了贡献指南(CONTRIBUTING.md),并遵守了其中的所有规定,包括但不限于commit message的格式、无效commit的合并等 - [ ] 🔍 邀请 committer评论/lgtm前的必要检查 - [x] 🏷️ 标题中使用了合适的类型标签(如:[feat], [fix]) - [x] 📄 代码修改内容已简要描述,相关文档已更新 - [x] 📝 代码注释已更新,代码遵循项目整体代码风格 - [x] 🧪 代码UT测试已更新,覆盖率已达标 - [x] 🔬 验证方法已更新到"测试"部分 - [x] 🛠️ 代码已通过静态分析工具检查,无错误 - [ ] 👥 代码检视/code review/同行评议和必要的代码串讲,确保代码质量 - [x] ✅ 代码检视意见已处理或答复,无未处理的检视意见 - [ ] 🚀 预约 前冒烟 用例前的必要检查 - [ ] ✔️ 代码已有committer的/lgtm 和 模块committer的/lgtm评论 - [ ] 🔧 代码已通过compile,编译无错误,无告警 - [ ] 🖥️ 代码已通过基本功能本地测试或者在线测试,确保基本功能正常 - [ ] 🎯 预约 approver评论/approve,正式合入前的必要检查 - [ ] 📊 前冒烟 用例已全量通过 - [ ] 📦 新增功能已同步补充基本功能测试用例到前冒烟里 See merge request: cann/hcomm!2253 | 6 天前 |