Star351
79
代码介绍
代码
Issues9
Pull Requests24
流水线
Actions
讨论
Wiki
项目成员675
分析
项目设置
Star351
79
  1. torchtitan-npu
  2. /
  3. torchtitan_npu
  4. /
  5. models
cann-robotcann-robot[fix] tune DeepSeek V4 expert parallel degree
7baa57fe创建于 2 天前历史提交
文件最后提交记录最后更新时间
common
fix: use module-level LOSS_SCALE global instead of class attribute15 天前
deepseek_v3
[fix] fix virtual_optimizer22 天前
deepseek_v32
[fix] fix scatter_/gather input index out of bounds21 天前
deepseek_v4
[fix] tune DeepSeek V4 expert parallel degree2 天前
llama4
Fixed license headers1 个月前