模型支持列表

🚨 弃用说明

本文档已过时,不再进行维护,并将在 1.6.0 版本下架,其中可能包含过时的信息或已被更新的功能替代。建议参考最新的 官方文档 ,以获取准确的信息。

如果您仍需使用本文档中的内容,请仔细核对其适用性,并结合最新版本的相关资源进行验证。

如有任何问题或建议,请通过 社区Issue 提交反馈。感谢您的理解与支持!

NLP

text_generation

模型
model
模型规格
type
数据集
dataset
评估指标
metric
评估得分
score
配置
config
llama2 llama2_7b
llama2_13b
llama2_7b_lora
llama2_13b_lora
llama2_70b
alpaca PPL / EM / F1 6.58 / 39.6 / 60.5
6.14 / 27.91 / 44.23
-
-
-
configs
llama3 llama3_8b
llama3_70b
alpaca - - configs
glm3 glm3_6b ADGEN - - configs
codellama codellama_34b CodeAlpaca - - configs
deepseek coder deepseek_33b CodeAlpaca - - configs
glm32k glm3_6b_32k LongBench - - configs
Qwen1.5 qwen1_5_7b
qwen1_5_14b
qwen1_5_72b
alpaca - - configs
internlm2 internlm2_7b
internlm2_20b
alpaca - - configs
mixtral mixtral_8x7b wikitext-2 - - configs

Multi-Modal

image_to_text_generation

模型
model
模型规格
type
数据集
dataset
评估指标
metric
评估得分
score
配置
config
QwenVL qwenvl_9.6b_bf16 LLaVa-150k detail_23k - - configs

LLM大模型能力支持一览

模型 \ 特性 低参微调 边训边评 Flash Attention 并行推理 流式推理 Chat 多轮对话
Llama2-7B/13B/70B Lora PPL dp/mp
Llama3-8B/70B - - dp/mp
CodeLlama-34B Lora HumanEval dp/mp - -
GLM2-6B Lora PPL/Bleu/Rouge dp/mp
GLM3-6B - - dp/mp
GLM3-6B-32k - - dp/mp
GPT2-128m/13B Lora PPL dp/mp - -
BaiChuan2-7B/13B Lora PPL dp/mp
Qwen-7B/14B Lora - dp/mp
QwenVL-9.6B - - dp/mp - -
Qwen-7B/14B/72B - - dp/mp
InternLM-7B/20B Lora PPL dp/mp
InternLM2-7B/20B - - dp/mp
Yi-6B/34B Lora - dp/mp
Mixtral-8x7B Lora - dp/mp - -
DeepSeek-33B Lora - dp/mp - -