数据负载均衡(数据分桶重排序)

数据分桶训练

对数据进行分桶重排序,使得数据层的负载达到更好的均衡。

数据负载均衡的方案分为两种:

​ 1. 数据分桶:性能优先,"priority_mode"配置为 "data_bucketing_img",若不配置,默认为数据分桶;

​ 2. 数据重排:精度优先,"priority_mode"配置为 "data_reordering_img"

使用方法(Qwen2VL 已支持)

Qwen2VL的数据分桶使用方法

在examples/qwen2vl/data_2b.json中,修改dataloader_param下的sampler_type为"BucketBatchSampler",且"priority_mode"配置为 "data_reordering_img",如下:

"dataloader_param": {
    "dataloader_mode": "sampler",
    "drop_last": true,
    "sampler_type": "BucketBatchSampler",
    "priority_mode": "data_reordering_img",
    "collate_param": {
        "model_name": "qwen2vl",
        "ignore_pad_token_for_loss": true
    },
    "pin_memory": true,
    "data_sharding": true,
    "shuffle": true
}