0
代码介绍
代码
Issues
Pull Requests
流水线
Actions
讨论
Wiki
项目成员
分析
项目设置
0
  1. mindformers
  2. /
  3. research
  4. /
  5. deepseek3
Jjimmyisme1fix: update tables in README and README_CN for clarity and consistency
fed8e474创建于 2025年6月26日历史提交
文件最后提交记录最后更新时间
deepseek3_671b
fix norm_topk_prob for deepseekv3 1 年前
deepseek_r1_671b
deepseek code sync from os branch 1 年前
README.md
fix: update tables in README and README_CN for clarity and consistency 11 个月前
convert_reversed.py
ds推理文档 1 年前
convert_weight.py
ds推理文档 1 年前
deepseek2_config.py
add enbale fa var len for deepseekv3 1 年前
deepseek2_model.py
fix reset position ids in megatron. 1 年前
deepseek3.py
deepseek code sync from os branch 1 年前
deepseek3_config.py
deepseek code sync from os branch 1 年前
deepseek3_conversation.py
deepseek3微调数据集预处理脚本上库 1 年前
deepseek3_model_infer.py
move self.shape for fusion quant ops 1 年前
deepseek3_model_train.py
deepseek code sync from os branch 1 年前
deepseek3_preprocess.py
deepseek3 Readme微调部分更新 1 年前
deepseek3_train2infer.py
deepseek3离线训转推脚本 1 年前
parallel_speed_up.json
deepseek3 关闭MC2 1 年前
run_predict_deepseek.py
ds推理文档 1 年前
utils.py
deepseek code sync from os branch 1 年前
wikitext_to_bin.py
deepseekv3 add megatron 1 年前