llama-3-chinese-8b-instruct-gguf:中文指令优化的量化版对话模型,支持多场景应用

基于Llama-3-Chinese-8B-Instruct的量化版本,适用于对话、问答等场景,兼容llama.cpp/ollama/tgw,新模型性能提升,PPL更低,提供多种量化规格选择。【此简介由AI生成】

分支1Tags0

license: apache-2.0 language:

  • zh
  • en

Llama-3-Chinese-8B-Instruct-GGUF

本仓库提供 Llama-3-Chinese-8B-Instruct-GGUF(兼容 llama.cpp/ollama/tgw 等框架),这是 Llama-3-Chinese-8B-Instruct 的量化版本。

注意:此为指令微调(对话)模型,适用于对话问答等场景。

详细性能数据及使用方式请参阅 GitHub 项目主页:https://github.com/ymcui/Chinese-LLaMA-Alpaca-3

性能表现

评估指标:PPL(困惑度),数值越低越好

注:因旧版模型性能较差(llama.cpp 对预分词器进行了破坏性更新),已从表格中移除。

量化方式 模型大小 PPL(旧版模型) 👍🏻 PPL(新版模型)
Q2_K 2.96 GB 10.3918 +/- 0.13288 9.1168 +/- 0.10711
Q3_K 3.74 GB 6.3018 +/- 0.07849 5.4082 +/- 0.05955
Q4_0 4.34 GB 6.0628 +/- 0.07501 5.2048 +/- 0.05725
Q4_K 4.58 GB 5.9066 +/- 0.07419 5.0189 +/- 0.05520
Q5_0 5.21 GB 5.8562 +/- 0.07355 4.9803 +/- 0.05493
Q5_K 5.34 GB 5.8062 +/- 0.07331 4.9195 +/- 0.05436
Q6_K 6.14 GB 5.7757 +/- 0.07298 4.8966 +/- 0.05413
Q8_0 7.95 GB 5.7626 +/- 0.07272 4.8822 +/- 0.05396
F16 14.97 GB 5.7628 +/- 0.07275 4.8802 +/- 0.05392

其他信息

项目介绍

基于Llama-3-Chinese-8B-Instruct的量化版本,适用于对话、问答等场景,兼容llama.cpp/ollama/tgw,新模型性能提升,PPL更低,提供多种量化规格选择。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新