0

0

chenrayray[Docs] Replace deprecate version to 1.6.0. Replace the dev link to r1.5.0

9fa6e2fb创建于 2025年4月14日历史提交

模型支持列表

🚨 弃用说明

本文档已过时，不再进行维护，并将在 1.6.0 版本下架，其中可能包含过时的信息或已被更新的功能替代。建议参考最新的 官方文档 ，以获取准确的信息。

如果您仍需使用本文档中的内容，请仔细核对其适用性，并结合最新版本的相关资源进行验证。

如有任何问题或建议，请通过 社区Issue 提交反馈。感谢您的理解与支持！

NLP

text_generation

模型 model	模型规格 type	数据集 dataset	评估指标 metric	评估得分 score	配置 config
llama2	llama2_7b llama2_13b llama2_7b_lora llama2_13b_lora llama2_70b	alpaca	PPL / EM / F1	6.58 / 39.6 / 60.5 6.14 / 27.91 / 44.23 - - -	configs
llama3	llama3_8b llama3_70b	alpaca	-	-	configs
glm3	glm3_6b	ADGEN	-	-	configs
codellama	codellama_34b	CodeAlpaca	-	-	configs
deepseek coder	deepseek_33b	CodeAlpaca	-	-	configs
glm32k	glm3_6b_32k	LongBench	-	-	configs
Qwen1.5	qwen1_5_7b qwen1_5_14b qwen1_5_72b	alpaca	-	-	configs
internlm2	internlm2_7b internlm2_20b	alpaca	-	-	configs
mixtral	mixtral_8x7b	wikitext-2	-	-	configs

image_to_text_generation

模型 model	模型规格 type	数据集 dataset	评估指标 metric	评估得分 score	配置 config
QwenVL	qwenvl_9.6b_bf16	LLaVa-150k detail_23k	-	-	configs

LLM大模型能力支持一览

模型 \ 特性	低参微调	边训边评	Flash Attention	并行推理	流式推理	Chat	多轮对话
Llama2-7B/13B/70B	Lora	PPL	✓	dp/mp	✓	✓	✓
Llama3-8B/70B	-	-	✓	dp/mp	✓	✓	✓
CodeLlama-34B	Lora	HumanEval	✓	dp/mp	✓	-	-
GLM2-6B	Lora	PPL/Bleu/Rouge	✓	dp/mp	✓	✓	✓
GLM3-6B	-	-	✓	dp/mp	✓	✓	✓
GLM3-6B-32k	-	-	✓	dp/mp	✓	✓	✓
GPT2-128m/13B	Lora	PPL	✓	dp/mp	✓	-	-
BaiChuan2-7B/13B	Lora	PPL	✓	dp/mp	✓	✓	✓
Qwen-7B/14B	Lora	-	✓	dp/mp	✓	✓	✓
QwenVL-9.6B	-	-	✓	dp/mp	✓	-	-
Qwen-7B/14B/72B	-	-	✓	dp/mp	✓	✓	✓
InternLM-7B/20B	Lora	PPL	✓	dp/mp	✓	✓	✓
InternLM2-7B/20B	-	-	✓	dp/mp	✓	✓	✓
Yi-6B/34B	Lora	-	✓	dp/mp	✓	✓	✓
Mixtral-8x7B	Lora	-	✓	dp/mp	✓	-	-
DeepSeek-33B	Lora	-	✓	dp/mp	✓	-	-