文件最后提交记录最后更新时间
Add HCCL in allgather_base backward Co-authored-by: limuan<liyijie16@huawei.com> # message auto-generated for no-merge-commit merge: !31736 merge issue_lyj/v2.7.1 into v2.7.1 Add HCCL in allgather_base backward Created-by: limuan Commit-by: limuan Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 - [ ] 需求 - [ ] 问题单 - [x] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 运行torch社区用例,test/distributed/test_c10d_wpawn_nccl.py -v -k test_all_gather_base 报Backend not supported!错误, 原因:allgather base 的backward中if dist.get_backend(group=ctx.group) is dist.Backend.NCCL: 为false 则直接raise RuntimeError("Backend not supported!") 修改:在torch_npu的init中 对allgather base的backward函数进行替换 if dist.get_backend(group=ctx.group) is dist.Backend.NCCL: 改为 if dist.get_backend(group=ctx.group) in (dist.Backend.NCCL, dist.Backend.HCCL): 其他不变 # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 ![image.png](https://raw.gitcode.com/user-images/assets/7404318/935b1769-e9a7-4b29-8309-8e1b6c362acb/image.png 'image.png') # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!317361 个月前
Add HCCL in allgather_base backward Co-authored-by: limuan<liyijie16@huawei.com> # message auto-generated for no-merge-commit merge: !31736 merge issue_lyj/v2.7.1 into v2.7.1 Add HCCL in allgather_base backward Created-by: limuan Commit-by: limuan Merged-by: ascend-robot Description: <!-- PR描述模板更新日期:20260203 --> # 【合入来源】 - [ ] 需求 - [ ] 问题单 - [x] issue/工单 - [ ] 重构优化 - [ ] 资料更新 # 【修改方案】 运行torch社区用例,test/distributed/test_c10d_wpawn_nccl.py -v -k test_all_gather_base 报Backend not supported!错误, 原因:allgather base 的backward中if dist.get_backend(group=ctx.group) is dist.Backend.NCCL: 为false 则直接raise RuntimeError("Backend not supported!") 修改:在torch_npu的init中 对allgather base的backward函数进行替换 if dist.get_backend(group=ctx.group) is dist.Backend.NCCL: 改为 if dist.get_backend(group=ctx.group) in (dist.Backend.NCCL, dist.Backend.HCCL): 其他不变 # 【资料变更】 不涉及 # 【接口变更】 不涉及 # 【功能验证】 > 说明测试场景,测试方法。如果本次测试方式与常规单元测试不同,请详细说明您的测试步骤\ > 新增/变更内容是否已新增/适配UT测试用例看护,并补充测试自验证截图 ![image.png](https://raw.gitcode.com/user-images/assets/7404318/935b1769-e9a7-4b29-8309-8e1b6c362acb/image.png 'image.png') # 【CheckList】 > PR提交人对以下CheckList自检项进行全量自检,自检通过或不涉及,均修改 [ ] 为 [x] - [x] 代码注释完备,正确记录错误日志 - [x] 代码实现进行了返回值、空指针等校验 - [x] PR标题正确使用类型标签,如:feat、fix、refactor、docs、test等 - [ ] PR持续集成流水线(CI)执行通过,代码检查无异常 See merge request: Ascend/pytorch!317361 个月前