文件最后提交记录最后更新时间
fix(rootinfo): 按 mainboard_id 选标卡 topo 文件,修复 350 被识别为 300a Co-authored-by: suqwe<sujianjia@huawei.com> # message auto-generated for no-merge-commit merge: !386 merge fix/rootinfo-topo-file-mainboard-id into master fix(rootinfo): 按 mainboard_id 选标卡 topo 文件,修复 350 被识别为 300a Created-by: suqwe Commit-by: suqwe Merged-by: cann-robot Description: ## 现象 tools/rootinfo/root_info_generate 在 Atlas 350 标卡(NOMESH/2PMESH/4PMESH)上生成 rootinfo 时,topo_file_path 一律是 atlas_300a.json,导致下游把 350 标卡识别成 300a。 ## 根因 src/host/transport/topo/rootinfo/aclshmemi_product_strategy.cpp:70aclshmemi_card_product_t::get_root_info 里写死了 atlas_300a.json,对所有标卡 mainboard_id 都生效。该 topo 文件名不在 hcomm 的映射表里。 ## 修复 按 mainboard_id 选 topo 文件,与 hcomm src/legacy/ascend950/framework/topo/topo_addr_info/src/topo.c 的映射对齐: | mainboard_id | topo 文件 | |---|---| | CARD_NOMESH (0x68) | atlas_350_1.json | | CARD_2PMESH (0x6a) | atlas_350_2.json | | CARD_4PMESH (0x6c) | atlas_350_3.json | 实现采用 [KEEP-NEW-SWITCH-CLEANUP] 模式: - [NEW] 新增 card_topo_filename(mainboard_id) 工具函数 - [SWITCH] aclshmemi_card_product_t::get_root_info 改为 build_topo_file_path(driver_path, card_topo_filename(mainboard_id)) - [CLEANUP] 删除原 "atlas_300a.json" 字面量 ## 验证 shmem_rootinfo target 在 -Werror 下编译通过。 Fix #282 See merge request: cann/shmem!3861 天前
feat: add generated rootinfo fallback Co-authored-by: hbhdhd<luxianbin1@huawei.com> # message auto-generated for no-merge-commit merge: !315 merge rootinfo into master feat: add generated rootinfo fallback Created-by: hbhdhd Commit-by: hbhdhd Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 为 UDMA 场景补充 rootinfo 自动生成 fallback 能力,提升网络 Topo 自动发现流程的可用性和部署兼容性。 当前 UDMA 初始化依赖 rootinfo/topo 信息完成 EID 路由选择。如果固定路径 /etc/hccl_rootinfo.json 不存在、解析失败或内容不可用,原流程会直接导致初始化失败。本次修改在保留优先读取本地 rootinfo 文件的基础上,增加通过 topo_addr_info_get_sizetopo_addr_info_get 动态生成 rootinfo 的兜底路径。 主要改动包括: - TopoReader::ParseRootInfo 支持按当前 phyId 获取 rootinfo。 - 优先读取 /etc/hccl_rootinfo.json,失败后 fallback 到 generated rootinfo。 - 统一复用 ParseRootInfoJson 解析文件 rootinfo 和生成 rootinfo。 - rootinfo 解析按当前物理设备过滤,只保留当前 phyId 对应的 rank 条目。 - 支持 EIDIPV4IPV6 地址格式解析并转换为 UDMA 使用的 raw EID。 - UDMA 初始化流程中增加 logic device 到 phy device 的映射,确保 rootinfo 和底层 RA 查询使用一致的物理设备 ID。 - 增加 ACL 动态加载接口,用于获取当前逻辑 device 对应的物理 device ID。 该修改可以降低 UDMA Topo 自动发现对固定 rootinfo 文件的强依赖,在 rootinfo 文件缺失或不可用时仍可尝试通过系统生成信息完成初始化。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> Issue [#175](https://gitcode.com/cann/shmem/issues/175) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ![ex.png](https://raw.gitcode.com/user-images/assets/8546182/9f814041-e74d-4469-a26c-dc9cde2b12ee/ex.png 'ex.png') ![ut.png](https://raw.gitcode.com/user-images/assets/8546182/675c3643-08ca-49c2-a18c-04bfa3ca51ea/ut.png 'ut.png') ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 无 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!31518 天前
feat: add generated rootinfo fallback Co-authored-by: hbhdhd<luxianbin1@huawei.com> # message auto-generated for no-merge-commit merge: !315 merge rootinfo into master feat: add generated rootinfo fallback Created-by: hbhdhd Commit-by: hbhdhd Merged-by: cann-robot Description: ## 描述 <!--在这里详细描述你的改动,包括改动的原因和所采取的方法。--> 为 UDMA 场景补充 rootinfo 自动生成 fallback 能力,提升网络 Topo 自动发现流程的可用性和部署兼容性。 当前 UDMA 初始化依赖 rootinfo/topo 信息完成 EID 路由选择。如果固定路径 /etc/hccl_rootinfo.json 不存在、解析失败或内容不可用,原流程会直接导致初始化失败。本次修改在保留优先读取本地 rootinfo 文件的基础上,增加通过 topo_addr_info_get_sizetopo_addr_info_get 动态生成 rootinfo 的兜底路径。 主要改动包括: - TopoReader::ParseRootInfo 支持按当前 phyId 获取 rootinfo。 - 优先读取 /etc/hccl_rootinfo.json,失败后 fallback 到 generated rootinfo。 - 统一复用 ParseRootInfoJson 解析文件 rootinfo 和生成 rootinfo。 - rootinfo 解析按当前物理设备过滤,只保留当前 phyId 对应的 rank 条目。 - 支持 EIDIPV4IPV6 地址格式解析并转换为 UDMA 使用的 raw EID。 - UDMA 初始化流程中增加 logic device 到 phy device 的映射,确保 rootinfo 和底层 RA 查询使用一致的物理设备 ID。 - 增加 ACL 动态加载接口,用于获取当前逻辑 device 对应的物理 device ID。 该修改可以降低 UDMA Topo 自动发现对固定 rootinfo 文件的强依赖,在 rootinfo 文件缺失或不可用时仍可尝试通过系统生成信息完成初始化。 ## 关联的Issue <!-- 如果这个PR是为了解决特定的Issue,请在这里提供Issue链接。例如:关联Issue #123--> <!-- 如果这个PR是为了解决特定的问题单,请在这里描述问题单单号。--> Issue [#175](https://gitcode.com/cann/shmem/issues/175) ## 测试 <!--描述进行了哪些测试来验证你的改动。包括但不限于二级冒烟、算子泛化等。--> ![ex.png](https://raw.gitcode.com/user-images/assets/8546182/9f814041-e74d-4469-a26c-dc9cde2b12ee/ex.png 'ex.png') ![ut.png](https://raw.gitcode.com/user-images/assets/8546182/675c3643-08ca-49c2-a18c-04bfa3ca51ea/ut.png 'ut.png') ## 文档更新 <!--如果这个PR包含文档的更新,请在这里指出。例如:更新了README.md文件。--> 无 ## 类型标签 <!-- [x] 表示选中 --> - [ ] Bug修复 - [x] 新特性 - [ ] 性能优化 - [ ] 文档更新 - [ ] 其他,请描述: See merge request: cann/shmem!31518 天前