Verl 使用 MindSpeed 训练后端

环境准备

1. MindSpeed 安装

请参见MindSpeed安装指导,下载安装对应的软件版本。

2. Verl 安装

请参见Verl Ascend Quickstart,下载安装对应的软件版本。

Note

若使用的CANN版本高于8.3.RC1,vllm和vllm-ascend安装版本须大于等于0.9.1,0.9.1版本vllm安装可参考vllm-ascend安装

使能 MindSpeed 后端

确认模型对应的 strategy 配置为 megatron,例如 actor_rollout_ref.actor.strategy=megatron,可以在 shell 脚本中或者 config 配置文档中设置。

MindSpeed 自定义入参可通过 override_transformer_config 参数传入,例如对 actor 模型开启 FA 特性可使用 +actor_rollout_ref.actor.megatron.override_transformer_config.use_flash_attn=True

特性支持列表

Note

"Preview"状态表示预览非正式发布版本,"Released"状态表示正式发布版本,"Dev"状态表示正在开发中。

表 1 特性列表

特性名称 配置参数 状态
FA(必须开) +actor_rollout_ref.actor.megatron.override_transformer_config.use_flash_attn=True Preview
TP actor_rollout_ref.actor.megatron.tensor_model_parallel_size Preview
PP actor_rollout_ref.actor.megatron.pipeline_model_parallel_size Preview
EP actor_rollout_ref.actor.megatron.expert_model_parallel_size Preview
ETP actor_rollout_ref.actor.megatron.expert_tensor_parallel_size Preview
SP actor_rollout_ref.actor.megatron.override_transformer_config.sequence_parallel Preview
分布式优化器 actor_rollout_ref.actor.megatron.override_transformer_config.use_distributed_optimizer Preview
重计算 actor_rollout_ref.actor.megatron.override_transformer_config.recompute_method
actor_rollout_ref.actor.megatron.override_transformer_config.recompute_granularity
actor_rollout_ref.actor.megatron.override_transformer_config.recompute_num_layers
Preview
CP actor_rollout_ref.actor.megatron.context_parallel_size
actor_rollout_ref.actor.megatron.override_transformer_config.context_parallel_size
Preview
mbridge actor_rollout_ref.actor.megatron.use_mbridge Preview
RoPE融合优化 +actor_rollout_ref.actor.megatron.override_transformer_config.position_embedding_type=rope
+actor_rollout_ref.actor.megatron.override_transformer_config.use_fused_rotary_pos_emb=True
Preview
SwiGLU融合优化 +actor_rollout_ref.actor.megatron.override_transformer_config.swiglu=True
+actor_rollout_ref.actor.megatron.override_transformer_config.use_fused_swiglu=True
Preview
RMSNorm融合优化 +actor_rollout_ref.actor.megatron.override_transformer_config.normalization=RMSNorm
+actor_rollout_ref.actor.megatron.override_transformer_config.use_fused_rmsnorm=True
Preview
MoE Grouped GEMM +actor_rollout_ref.actor.megatron.override_transformer_config.moe_grouped_gemm=True Preview
MoE Token Permute and Unpermute 融合优化 +actor_rollout_ref.actor.megatron.override_transformer_config.use_fused_moe_token_permute_and_unpermute=True Preview

表 2 特性补充说明

特性名称 说明
mbridge 暂不支持同时开启VPP。
VPP 请在未开启mbridge时使用。