Star335
64
代码介绍
代码
Issues10
Pull Requests8
流水线
Actions
讨论
Wiki
项目成员96
分析
项目设置
Star335
64
  1. cann-recipes-train
  2. /
  3. llm_pretrain
cann-robotcann-robotdelta_net - a linear attention demo for llm training
d17909ef创建于 8 天前历史提交
文件最后提交记录最后更新时间
DeepSeekV3
[docs]: 修改文档中的一些文本错误20 天前
ascend_tla_deltanet
delta_net - a linear attention demo for llm training8 天前
deepseekv32
[feat] Update DeepSeek-V32 pre-training23 天前
deepseekv4
【docs】更新支持DSV4 Flash/Pro 模型的相关镜像和版本信息15 天前