Star69
136
代码介绍
代码
Issues9
Pull Requests22
流水线
Actions
讨论
Wiki
项目成员34
分析
项目设置
Star69
136
  1. MindSpeed-RL
  2. /
  3. configs
ascend-robotascend-robotfix dpo for 2.2.0
e10ef94c创建于 2025年11月26日历史提交
文件最后提交记录最后更新时间
checkpoint
!588 back core0.8.08 个月前
datasets
2.2.0文档修改7 个月前
envs
!534 update core0.12.19 个月前
model
fix grpo loss&reward7 个月前
dapo_qwen25_32b_A2_20k.yaml
actor_update_dispatch_size脚本值的修改8 个月前
dapo_qwen25_32b_A3.yaml
!484 【DAPO】filter_groups_metric参数优化10 个月前
dapo_qwen25_32b_A3_32k.yaml
actor_update_dispatch_size脚本值的修改8 个月前
dapo_qwen3_30b_a3b_A3.yaml
!588 back core0.8.08 个月前
dapo_qwen3_32b_A3.yaml
!489 支持qwen3 32b模型dapo10 个月前
dpo_qwen3_30b_a3b_A3.yaml
fix dpo for 2.2.06 个月前
grpo_deepseek_r1_671b_A2.yaml
fix deepseek grpo 2.2.07 个月前
grpo_deepseek_r1_671b_A3.yaml
fix deepseek grpo 2.2.07 个月前
grpo_deepseek_r1_671b_A3_eplb.yaml
fix dynamic_batch_size and eplb for ds671B8 个月前
grpo_qwen25_32b_A2.yaml
fix grpo loss&reward7 个月前
grpo_qwen25_32b_A3.yaml
fix grpo qwen 32b A3 reward -> 2.2.08 个月前
grpo_qwen25_7b_A3.yaml
!534 update core0.12.19 个月前
grpo_qwen3_235b_a22b_A2.yaml
!586 fix CP + removing padding8 个月前
grpo_qwen3_8b_A3.yaml
!586 fix CP + removing padding8 个月前
ppo_qwen25_32b_A3.yaml
!526 【修改说明】ppo bug fix9 个月前