| fix code static check
| 1 年前 |
| update model performance.
| 1 年前 |
| "sft 梯度累加 对齐 megatron"
| 1 年前 |
| [Bugfix] fix deepseekv2 train
| 1 年前 |
| fix code static check
| 1 年前 |
| fix code static check
| 1 年前 |
| [Bugfix] fix deepseekv2 train
| 1 年前 |
| fix prediction yaml
| 1 年前 |
| fix code static check
| 1 年前 |