Star
351
Fork
79
代码
介绍
代码
Issues
9
Pull Requests
24
流水线
Actions
讨论
Wiki
项目成员
675
分析
项目设置
Star
351
Fork
79
v0.2.2-dev
torchtitan-npu
/
torchtitan_npu
/
models
下载当前目录
cann-robot
[fix] tune DeepSeek V4 expert parallel degree
7baa57fe
创建于
2 天前
历史提交
文件
最后提交记录
最后更新时间
common
fix: use module-level LOSS_SCALE global instead of class attribute
15 天前
deepseek_v3
[fix] fix virtual_optimizer
22 天前
deepseek_v32
[fix] fix scatter_/gather input index out of bounds
21 天前
deepseek_v4
[fix] tune DeepSeek V4 expert parallel degree
2 天前
llama4
Fixed license headers
1 个月前