Star335
64
代码介绍
代码
Issues10
Pull Requests8
流水线
Actions
讨论
Wiki
项目成员96
分析
项目设置
Star335
64
  1. cann-recipes-train
  2. /
  3. agent_rl
  4. /
  5. qwen2_code_rl
  6. /
  7. figures
cann-robotcann-robot[docs] Add Qwen3 Code RL examples
acdaec13创建于 2月14日历史提交
文件最后提交记录最后更新时间
reward_deepseek_r1_distill_qwen_1_5b.png
[docs] Add Qwen3 Code RL examples3 个月前
reward_qwen3_30b_a3b.png
[docs] Add Qwen3 Code RL examples3 个月前
reward_qwen3_4b.png
[docs] Add Qwen3 Code RL examples3 个月前
training_progress_deepseek_r1_distill_qwen_1_5b.png
[docs] Add Qwen3 Code RL examples3 个月前
training_progress_qwen3_30b_a3b.png
[docs] Add Qwen3 Code RL examples3 个月前
training_progress_qwen3_4b.png
[docs] Add Qwen3 Code RL examples3 个月前