基于新型2-bit量化方法的GGUF格式模型集合,适用于llama.cpp,需配合指定PR版本使用。部分模型优化量化误差,尺寸略增约10%。【此简介由AI生成】
采用新型2位量化方法生成的GGUF格式多模型集。专为搭配llama.cpp使用,需配合llama.cpp的PR 4773版本。
更新说明:PR 4773已合并至llama.cpp主分支,但新增模型需使用PR 4856版本。 新增模型比特率约为2.3-2.4 bpw,通过增加约10%的模型体积,显著降低了量化误差。
llama.cpp
项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新