Distributed接口列表
本章节包含适配后的分布式接口,提供并行计算能力。
表1 Distributed API
torch.distributed.distributed_c10d._world.default_pg._get_backend(torch.device("npu")).get_hccl_comm_name |
|
参考原生接口torch.distributed.reduce_scatter_tensor功能,torch_npu.distributed.reduce_scatter_tensor_uneven接口新增支持零拷贝和非等长切分功能。 |
|
参考原生接口torch.distributed.all_gather_into_tensor功能,torch_npu.distributed.all_gather_into_tensor_uneven接口新增支持零拷贝和非等长切分功能。 |