Star335
64
代码介绍
代码
Issues10
Pull Requests8
流水线
Actions
讨论
Wiki
项目成员96
分析
项目设置
Star335
64
  1. cann-recipes-train
  2. /
  3. agent_rl
  4. /
  5. qwen2_code_rl
  6. /
  7. patches
cann-robotcann-robot[feat] Support DeepSeek-R1-Distill-Qwen-1.5B Model for Code RL
4ca19017创建于 2025年12月27日历史提交
文件最后提交记录最后更新时间
verl
[feat] Support DeepSeek-R1-Distill-Qwen-1.5B Model for Code RL5 个月前