基于Llama-3-Chinese-8B-Instruct的量化版本，适用于对话、问答等场景，兼容llama.cpp/ollama/tgw，新模型性能提升，PPL更低，提供多种量化规格选择。【此简介由AI生成】

50bbd975创建于 2024年4月30日35次提交

文件	最后提交记录	最后更新时间
.gitattributes	Upload ggml-model-q4_0-im.gguf with huggingface_hub	2 年前
README.md	Update README.md	2 年前
ggml-model-f16.ggufLFS	Upload ggml-model-f16.gguf with huggingface_hub	2 年前
ggml-model-q2_k.ggufLFS	Upload ggml-model-q2_k.gguf with huggingface_hub	2 年前
ggml-model-q3_k.ggufLFS	Upload ggml-model-q3_k.gguf with huggingface_hub	2 年前
ggml-model-q4_0.ggufLFS	Upload ggml-model-q4_0.gguf with huggingface_hub	2 年前
ggml-model-q4_k.ggufLFS	Upload ggml-model-q4_k.gguf with huggingface_hub	2 年前
ggml-model-q5_0.ggufLFS	Upload ggml-model-q5_0.gguf with huggingface_hub	2 年前
ggml-model-q5_k.ggufLFS	Upload ggml-model-q5_k.gguf with huggingface_hub	2 年前
ggml-model-q6_k.ggufLFS	Upload ggml-model-q6_k.gguf with huggingface_hub	2 年前
ggml-model-q8_0.ggufLFS	Upload ggml-model-q8_0.gguf with huggingface_hub	2 年前

自动翻译

license: apache-2.0 language:

Llama-3-Chinese-8B-Instruct-GGUF

本仓库提供 Llama-3-Chinese-8B-Instruct-GGUF（兼容 llama.cpp/ollama/tgw 等框架），这是 Llama-3-Chinese-8B-Instruct 的量化版本。

注意：此为指令微调（对话）模型，适用于对话问答等场景。

详细性能数据及使用方式请参阅 GitHub 项目主页：https://github.com/ymcui/Chinese-LLaMA-Alpaca-3

性能表现

评估指标：PPL（困惑度），数值越低越好

注：因旧版模型性能较差（llama.cpp 对预分词器进行了破坏性更新），已从表格中移除。

量化方式	模型大小	PPL（旧版模型）	👍🏻 PPL（新版模型）
Q2_K	2.96 GB	10.3918 +/- 0.13288	9.1168 +/- 0.10711
Q3_K	3.74 GB	6.3018 +/- 0.07849	5.4082 +/- 0.05955
Q4_0	4.34 GB	6.0628 +/- 0.07501	5.2048 +/- 0.05725
Q4_K	4.58 GB	5.9066 +/- 0.07419	5.0189 +/- 0.05520
Q5_0	5.21 GB	5.8562 +/- 0.07355	4.9803 +/- 0.05493
Q5_K	5.34 GB	5.8062 +/- 0.07331	4.9195 +/- 0.05436
Q6_K	6.14 GB	5.7757 +/- 0.07298	4.8966 +/- 0.05413
Q8_0	7.95 GB	5.7626 +/- 0.07272	4.8822 +/- 0.05396
F16	14.97 GB	5.7628 +/- 0.07275	4.8802 +/- 0.05392

项目总下载次数（含Clone、Pull、 zip 包及 release 下载），每日凌晨更新