| !588 back core0.8.0 | 8 个月前 |
| 2.2.0文档修改 | 7 个月前 |
| !534 update core0.12.1 | 9 个月前 |
| fix grpo loss&reward | 7 个月前 |
| actor_update_dispatch_size脚本值的修改 | 8 个月前 |
| !484 【DAPO】filter_groups_metric参数优化 | 10 个月前 |
| actor_update_dispatch_size脚本值的修改 | 8 个月前 |
| !588 back core0.8.0 | 8 个月前 |
| !489 支持qwen3 32b模型dapo | 10 个月前 |
| fix dpo for 2.2.0 | 6 个月前 |
| fix deepseek grpo 2.2.0 | 7 个月前 |
| fix deepseek grpo 2.2.0 | 7 个月前 |
| fix dynamic_batch_size and eplb for ds671B | 8 个月前 |
| fix grpo loss&reward | 7 个月前 |
| fix grpo qwen 32b A3 reward -> 2.2.0 | 8 个月前 |
| !534 update core0.12.1 | 9 个月前 |
| !586 fix CP + removing padding | 8 个月前 |
| !586 fix CP + removing padding | 8 个月前 |
| !526 【修改说明】ppo bug fix | 9 个月前 |