TransferConfig

产品支持情况

产品 是否支持
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 推理系列产品
Atlas A2 训练系列产品 x

函数功能

构造TransferConfig。

函数原型

__init__(dst_cluster_id: int, dst_addrs: List[int], src_layer_range: Optional[range] = None, src_batch_index: int = 0)

参数说明

参数名 数据类型 取值说明
dst_cluster_id int 目的Cache所在实例的cluster_id。
dst_addrs List[int] 目的Cache中各tensor的内存地址。如果目的Cache为非PA场景,且需要传输到的batch_index非0,则此处需要将dst_addrs偏移到实际地址。
src_layer_range Optional[range] 本地要传输的层的范围,step只支持为1,默认为None,表示传输所有层。
src_batch_index int 本地cache的batch下标。当源Cache为非PA场景时可以设置。

调用示例

from llm_datadist import TransferConfig
TransferConfig(1, dst_addrs, range(0, 3), 1)

返回值

正常情况下返回TransferConfig的实例。

参数错误可能抛出TypeError或ValueError。

src_layer_range不合法会抛出LLMException

约束说明

目标地址列表中地址的个数需要为需要传输的层数的2倍。