Star69
136
代码介绍
代码
Issues9
Pull Requests22
流水线
Actions
讨论
Wiki
项目成员34
分析
项目设置
Star69
136
  1. MindSpeed-RL
  2. /
  3. examples
  4. /
  5. ppo
ascend-robotascend-robot2.2.0资料修改
df212e56创建于 2025年11月29日历史提交
文件最后提交记录最后更新时间
ppo_trainer_qwen25_32b.sh
2.2.0资料修改6 个月前