| fix norm_topk_prob for deepseekv3
| 1 年前 |
| deepseek code sync from os branch
| 1 年前 |
| fix: update tables in README and README_CN for clarity and consistency
| 11 个月前 |
| ds推理文档
| 1 年前 |
| ds推理文档
| 1 年前 |
| add enbale fa var len for deepseekv3
| 1 年前 |
| fix reset position ids in megatron.
| 1 年前 |
| deepseek code sync from os branch
| 1 年前 |
| deepseek code sync from os branch
| 1 年前 |
| deepseek3微调数据集预处理脚本上库
| 1 年前 |
| move self.shape for fusion quant ops
| 1 年前 |
| deepseek code sync from os branch
| 1 年前 |
| deepseek3 Readme微调部分更新
| 1 年前 |
| deepseek3离线训转推脚本
| 1 年前 |
| deepseek3 关闭MC2
| 1 年前 |
| ds推理文档
| 1 年前 |
| deepseek code sync from os branch
| 1 年前 |
| deepseekv3 add megatron
| 1 年前 |