0
代码介绍
代码
Issues
Pull Requests
流水线
Actions
讨论
Wiki
项目成员
分析
项目设置
0
  1. mindformers
  2. /
  3. research
  4. /
  5. deepseek
Nniujunhaoupdate model performance.
9719c5cd创建于 2024年10月26日历史提交
文件最后提交记录最后更新时间
alpaca_converter.py
静态代码检查问题 1 年前
convert_reversed.py
MindFormers部分静态检查问题修复 1 年前
convert_weight.py
MindFormers部分静态检查问题修复 1 年前
deepseek.md
update model performance. 1 年前
deepseek_preprocess.py
fix code static check 1 年前
finetune_deepseek_33b.yaml
fix:[ST][MF][全量]deepseek_coder_33b网络训练loss异常 https://e.gitee.com/mind_spore/projects/67813/bugs/table?issue=IAQCVU, 默认走小算子 rms_norm 1 年前
predict_deepseek_33b.yaml
删除graph_kernel_flags相关信息 1 年前
pretrain_deepseek_33b_16k.yaml
修改schedule拼写错误以及pp/mp与vocab_emv_dp不兼容错误 1 年前