Star351
78
代码介绍
代码
Issues9
Pull Requests21
流水线
Actions
讨论
Wiki
项目成员675
分析
项目设置
Star351
78
  1. torchtitan-npu
  2. /
  3. torchtitan_npu
  4. /
  5. distributed
cann-robotcann-robotDeepSeek-V4支持BSND shape下的序列切分 | 去除MindSpeed算子依赖
a223bdf5创建于 23 天前历史提交
文件最后提交记录最后更新时间
context_parallel
DeepSeek-V4支持BSND shape下的序列切分 | 去除MindSpeed算子依赖23 天前