Rombos-LLM-V2.5-Qwen-14b:基于Qwen2.5-14B持续微调,Ties融合技术提升性能

Qwen2.5-14B的持续微调版本,采用Ties融合方法结合指令与基础模型,性能超越原版,在IFEval等多项基准测试中表现优异。【此简介由AI生成】

分支1Tags0
93291429创建于 2024年10月6日4次提交
文件最后提交记录最后更新时间
initial commit1 年前
Update README.md1 年前

license: apache-2.0 library_name: transformers base_model:


Rombos-LLM-V2.5-Qwen-14b

image/jpeg

Rombos-LLM-V2.5-Qwen-14b 是基于 Qwen2.5-14B 持续微调的进阶版本。近期我注意到 Qwen 团队并未借鉴我采用的持续微调方法——这种方法能带来显著优势且没有任何副作用。因此我亲自采用 Ties 融合技术将指导模型与基础模型进行了融合。

该版本模型展现出比原版指导模型和基础模型更卓越的性能。

量化版本:

GGUF格式:https://huggingface.co/bartowski/Replete-LLM-V2.5-Qwen-14b-GGUF

性能基准测试:

开放大模型排行榜评估结果

详细结果请查阅此处

评估指标 数值
综合平均分 34.52
IFEval (零样本) 58.40
BBH (三样本) 49.39
MATH 五级难度 (四样本) 15.63
GPQA (零样本) 16.22
MuSR (零样本) 18.83
MMLU-PRO (五样本) 48.62

项目介绍

Qwen2.5-14B的持续微调版本,采用Ties融合方法结合指令与基础模型,性能超越原版,在IFEval等多项基准测试中表现优异。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新