数据负载均衡(数据分桶重排序)
数据分桶训练
对数据进行分桶重排序,使得数据层的负载达到更好的均衡。
数据负载均衡的方案分为两种:
1. 数据分桶:性能优先,"priority_mode"配置为 "data_bucketing_img",若不配置,默认为数据分桶;
2. 数据重排:精度优先,"priority_mode"配置为 "data_reordering_img"
使用方法(Qwen2VL 已支持)
Qwen2VL的数据分桶使用方法:
在examples/qwen2vl/data_2b.json中,修改dataloader_param下的sampler_type为"BucketBatchSampler",且"priority_mode"配置为 "data_reordering_img",如下:
"dataloader_param": {
"dataloader_mode": "sampler",
"drop_last": true,
"sampler_type": "BucketBatchSampler",
"priority_mode": "data_reordering_img",
"collate_param": {
"model_name": "qwen2vl",
"ignore_pad_token_for_loss": true
},
"pin_memory": true,
"data_sharding": true,
"shuffle": true
}