0
代码介绍
代码
Issues
Pull Requests
流水线
Actions
讨论
Wiki
项目成员
分析
项目设置
0
  1. mindformers
  2. /
  3. research
  4. /
  5. deepseek3
  6. /
  7. deepseek_r1_671b
wang_shaocongwang_shaocong1. ds-r1 ep and add ut/st
01aaed17创建于 2025年5月30日历史提交
文件最后提交记录最后更新时间
predict_deepseek_r1_671b.yaml
deepseek v3/r1 and qwen support chunked prefill and prefix caching, kvcache input 1 年前
predict_deepseek_r1_671b_w8a8.yaml
1. ds-r1 ep and add ut/st 2. mtp support 0.8.3 3. remove pynative judgement for the unit of eager mode and graph mode 11 个月前
predict_deepseek_r1_671b_w8a8_ep16.yaml
1. ds-r1 ep and add ut/st 2. mtp support 0.8.3 3. remove pynative judgement for the unit of eager mode and graph mode 11 个月前
predict_deepseek_r1_671b_w8a8_ep4tp4.yaml
1. ds-r1 ep and add ut/st 2. mtp support 0.8.3 3. remove pynative judgement for the unit of eager mode and graph mode 11 个月前