Star335
64
代码介绍
代码
Issues10
Pull Requests8
流水线
Actions
讨论
Wiki
项目成员96
分析
项目设置
Star335
64
  1. cann-recipes-train
  2. /
  3. llm_rl
  4. /
  5. qwen3
  6. /
  7. internal
cann-robotcann-robot feat(llm_rl/qwen3): add length-aware resampler for veRL rollout
ba7be607创建于 27 天前历史提交
文件最后提交记录最后更新时间
qwen3_235b_env.sh
[fix] bugfix for qwen3-235B OOM3 个月前
qwen3_32b_env.sh
[fix] bugfix for qwen3-235B OOM3 个月前
train_dapo_qwen3_235b_128die_true_weight.sh
[fix] bugfix for qwen3-235B OOM3 个月前
train_dapo_qwen3_32b_32die_true_weight.sh
[fix] bugfix for qwen3-235B OOM3 个月前
train_grpo_qwen3_235b_128die_random_init.sh
[refactor] support npugraph_ex + CANN 8.5.0 + vllm-ascend v0.14.04 个月前
train_grpo_qwen3_235b_128die_true_weight.sh
[fix] bugfix for qwen3-235B OOM3 个月前
train_grpo_qwen3_32b_32die_true_weight.sh
[fix] bugfix for qwen3-235B OOM3 个月前
train_grpo_qwen3_resampler_example.sh
feat(llm_rl/qwen3): add length-aware resampler for veRL rollout27 天前