模型支持列表
🚨 弃用说明
本文档已过时,不再进行维护,并将在 1.6.0 版本下架,其中可能包含过时的信息或已被更新的功能替代。建议参考最新的 官方文档 ,以获取准确的信息。
如果您仍需使用本文档中的内容,请仔细核对其适用性,并结合最新版本的相关资源进行验证。
如有任何问题或建议,请通过 社区Issue 提交反馈。感谢您的理解与支持!
NLP
text_generation
| 模型 model |
模型规格 type |
数据集 dataset |
评估指标 metric |
评估得分 score |
配置 config |
|---|---|---|---|---|---|
| llama2 | llama2_7b llama2_13b llama2_7b_lora llama2_13b_lora llama2_70b |
alpaca | PPL / EM / F1 | 6.58 / 39.6 / 60.5 6.14 / 27.91 / 44.23 - - - |
configs |
| llama3 | llama3_8b llama3_70b |
alpaca | - | - | configs |
| glm3 | glm3_6b | ADGEN | - | - | configs |
| codellama | codellama_34b | CodeAlpaca | - | - | configs |
| deepseek coder | deepseek_33b | CodeAlpaca | - | - | configs |
| glm32k | glm3_6b_32k | LongBench | - | - | configs |
| Qwen1.5 | qwen1_5_7b qwen1_5_14b qwen1_5_72b |
alpaca | - | - | configs |
| internlm2 | internlm2_7b internlm2_20b |
alpaca | - | - | configs |
| mixtral | mixtral_8x7b | wikitext-2 | - | - | configs |
Multi-Modal
image_to_text_generation
| 模型 model |
模型规格 type |
数据集 dataset |
评估指标 metric |
评估得分 score |
配置 config |
|---|---|---|---|---|---|
| QwenVL | qwenvl_9.6b_bf16 | LLaVa-150k detail_23k | - | - | configs |
LLM大模型能力支持一览
| 模型 \ 特性 | 低参微调 | 边训边评 | Flash Attention | 并行推理 | 流式推理 | Chat | 多轮对话 |
|---|---|---|---|---|---|---|---|
| Llama2-7B/13B/70B | Lora | PPL | ✓ | dp/mp | ✓ | ✓ | ✓ |
| Llama3-8B/70B | - | - | ✓ | dp/mp | ✓ | ✓ | ✓ |
| CodeLlama-34B | Lora | HumanEval | ✓ | dp/mp | ✓ | - | - |
| GLM2-6B | Lora | PPL/Bleu/Rouge | ✓ | dp/mp | ✓ | ✓ | ✓ |
| GLM3-6B | - | - | ✓ | dp/mp | ✓ | ✓ | ✓ |
| GLM3-6B-32k | - | - | ✓ | dp/mp | ✓ | ✓ | ✓ |
| GPT2-128m/13B | Lora | PPL | ✓ | dp/mp | ✓ | - | - |
| BaiChuan2-7B/13B | Lora | PPL | ✓ | dp/mp | ✓ | ✓ | ✓ |
| Qwen-7B/14B | Lora | - | ✓ | dp/mp | ✓ | ✓ | ✓ |
| QwenVL-9.6B | - | - | ✓ | dp/mp | ✓ | - | - |
| Qwen-7B/14B/72B | - | - | ✓ | dp/mp | ✓ | ✓ | ✓ |
| InternLM-7B/20B | Lora | PPL | ✓ | dp/mp | ✓ | ✓ | ✓ |
| InternLM2-7B/20B | - | - | ✓ | dp/mp | ✓ | ✓ | ✓ |
| Yi-6B/34B | Lora | - | ✓ | dp/mp | ✓ | ✓ | ✓ |
| Mixtral-8x7B | Lora | - | ✓ | dp/mp | ✓ | - | - |
| DeepSeek-33B | Lora | - | ✓ | dp/mp | ✓ | - | - |