Star337
64
代码介绍
代码
Issues11
Pull Requests5
流水线
Actions
讨论
Wiki
项目成员96
分析
项目设置
Star337
64
  1. cann-recipes-train
  2. /
  3. agent_rl
  4. /
  5. qwen2_code_rl
  6. /
  7. patches
  8. /
  9. verl
cann-robotcann-robot[feat] Support DeepSeek-R1-Distill-Qwen-1.5B Model for Code RL
4ca19017创建于 2025年12月27日历史提交
文件最后提交记录最后更新时间
0001-verl-feature-improve_rl_usability.patch
[feat] Support DeepSeek-R1-Distill-Qwen-1.5B Model for Code RL5 个月前