0
代码介绍
代码
Issues
Pull Requests
流水线
Actions
讨论
Wiki
项目成员
分析
项目设置
0
  1. mindformers
  2. /
  3. research
Hhss-shuaichange dataset link
b2bad52c创建于 2025年2月22日历史提交
文件最后提交记录最后更新时间
baichuan2
"sft 梯度累加 对齐 megatron" 1 年前
deepseek
update model performance. 1 年前
deepseek1_5
update model performance. 1 年前
deepseek2
"sft 梯度累加 对齐 megatron" 1 年前
glm32k
update model performance. 1 年前
internlm
change dataset link 1 年前
internlm2
set default qkv_concat False 1 年前
llama3
fix llama doc 1 年前
llama3_1
fix llama doc 1 年前
llm_boost
fix doc error 1 年前
mixtral
fix llama doc 1 年前
qwen
【bugfix】r1.3.0 修复 qwen 权重切分时报错 NotImplementedError 1 年前
qwen1_5
update default qwen15 yaml 1 年前
qwen2
update model performance. 1 年前
qwenvl
qwenvl doc update 1 年前
telechat2
telecha2 文档修改和yaml配置修改 1 年前
yi
change dataset link 1 年前
README.md
update research/README.md. Signed-off-by: 周胜凯 <zhoushengkai1@huawei.com>2 年前
run_multinode.sh
internlm启动脚本,预处理脚本,readme 2 年前
run_singlenode.sh
internlm启动脚本,预处理脚本,readme 2 年前