various-2bit-sota-gguf:采用新型2-bit量化方法的GGUF格式模型集合

基于新型2-bit量化方法的GGUF格式模型集合,适用于llama.cpp,需配合指定PR版本使用。部分模型优化量化误差,尺寸略增约10%。【此简介由AI生成】

分支1Tags0
文件最后提交记录最后更新时间
Adding first set of models 2 年前
Update README.md2 年前
Adding first set of models 2 年前
Adding 2.31-bpw base quantized models 2 年前
Adding more 2 年前
Adding 2.31-bpw base quantized models 2 年前
Adding first set of models 2 年前
Adding 2.31-bpw base quantized models 2 年前
Adding first set of models 2 年前
Adding 2.31-bpw base quantized models 2 年前
Adding Mistral instruct models 2 年前
Adding Mixtral-8x7b 2 年前
Adding 2.31-bpw base quantized models 2 年前
Adding Mixtral-instruct-8x7b 2 年前
Adding Mistral instruct models 2 年前
Adding Nous-Hermes-2-SOLAR-10.7B 2-bit quants 2 年前
Adding Nous-Hermes 2.31 bpw quantized models 2 年前
Adding Nous-Hermes-2-SOLAR-10.7B 2-bit quants 2 年前
Adding Nous-Hermes-2-Yi-34B 2-bit quants 2 年前
Adding Nous-Hermes 2.31 bpw quantized models 2 年前
Adding Nous-Hermes-2-Yi-34B 2-bit quants 2 年前
Adding Rocket-3b 2-bit quants 2 年前
Adding Rocket-3b 2-bit quants 2 年前

license: apache-2.0

采用新型2位量化方法生成的GGUF格式多模型集。专为搭配llama.cpp使用,需配合llama.cpp的PR 4773版本。

更新说明:PR 4773已合并至llama.cpp主分支,但新增模型需使用PR 4856版本。 新增模型比特率约为2.3-2.4 bpw,通过增加约10%的模型体积,显著降低了量化误差。

项目介绍

基于新型2-bit量化方法的GGUF格式模型集合,适用于llama.cpp,需配合指定PR版本使用。部分模型优化量化误差,尺寸略增约10%。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新