MindSpeed-MM/examples/internvl3.5/fsdp2_config.yaml-代码预览-MindSpeed-MM:基于昇腾芯片的多模态大模型训练套件项目 - AtomGit

ascend-robot[Docs] internvl3.5 docs & config modify

3fd2b5c4创建于 2025年11月20日历史提交

sharding_size: auto
sub_modules_to_wrap:
  - vision_model.embeddings
  - vision_model.encoder.layers.{*}
  - language_model.model.layers.{*}
recompute_modules:
  - vision_model.embeddings
  - vision_model.encoder.layers.{*}
  - language_model.model.layers.{*}
reshard_after_forward: True
param_dtype: bf16
reduce_dtype: fp32
cast_forward_inputs: True