Star180
224
代码介绍
代码
Issues56
Pull Requests53
流水线
Actions
讨论
Wiki
项目成员54
分析
项目设置
Star180
224
  1. MindSpeed-LLM
  2. /
  3. tests
  4. /
  5. pipeline
  6. /
  7. st
  8. /
  9. qwen3-30b
ascend-robotascend-robottest(megatron):rl testcase remove
cfd4e356创建于 4月10日历史提交
文件最后提交记录最后更新时间
dpo_qwen3_30b_a3b_16K_A3_ptd_tp2pp4.sh
fix(pytorch):add ckpt-format argument to scripts2 个月前
qwen3-30b-layer2-dist.sh
test(megatron):rl testcase remove2 个月前
tune_qwen3_30b_a3b_4K_full_ptd_tp4_pp2_ep1.sh
feat: add w4a16 quant2 个月前