QwenVL系列支持非均匀Ulysses CP切分
问题分析
CP(Context Parallel)并行算法是一种针对长序列数据处理的并行化技术,在处理长序列时具有显著优势。多模态模型存在大量序列长度非均匀场景,需要进行相应的适配。
解决方案
Ulysses CP算法基于All2All算子,对All2All算子的Input List与Output List根据序列长度进行非均匀切分,使能Ulysses算法。

使用方法
(当前仅支持qwen2vl、qwen2.5vl)
qwen2vl、qwen2.5vl使用方法,以qwen2vl72b为例
-
examples/qwen2vl/finetune_qwen2vl_72b.sh中设置CP大小,默认脚本中为1
CP=1 -
examples/qwen2vl/finetune_qwen2vl_72b.sh中的GPT_ARGS添加
--context-parallel-algo ulysses_cp_algo