| "sft 梯度累加 对齐 megatron"
| 1 年前 |
| update model performance.
| 1 年前 |
| update model performance.
| 1 年前 |
| "sft 梯度累加 对齐 megatron"
| 1 年前 |
| update model performance.
| 1 年前 |
| change dataset link
| 1 年前 |
| set default qkv_concat False
| 1 年前 |
| fix llama doc
| 1 年前 |
| fix llama doc
| 1 年前 |
| fix doc error
| 1 年前 |
| fix llama doc
| 1 年前 |
| 【bugfix】r1.3.0 修复 qwen 权重切分时报错 NotImplementedError
| 1 年前 |
| update default qwen15 yaml
| 1 年前 |
| update model performance.
| 1 年前 |
| qwenvl doc update
| 1 年前 |
| telecha2 文档修改和yaml配置修改
| 1 年前 |
| change dataset link
| 1 年前 |
| update research/README.md.
Signed-off-by: 周胜凯 <zhoushengkai1@huawei.com> | 2 年前 |
| internlm启动脚本,预处理脚本,readme
| 2 年前 |
| internlm启动脚本,预处理脚本,readme
| 2 年前 |