Vero-Qwen3I-8B-i1-GGUF:基于GGUF格式的视觉语言模型量化项目

可用于视觉推理等多模态任务，提供多种i1-GGUF量化版本，支持不同大小与质量需求，包含imatrix文件便于自定义量化，是Vero-Qwen3I-8B模型的便捷部署方案。【此简介由AI生成】

文件	最后提交记录	最后更新时间
.gitattributes	uploaded from nico1	1 个月前
README.md	auto-patch README.md	1 个月前
Vero-Qwen3I-8B.i1-IQ1_M.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-IQ1_S.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-IQ2_M.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-IQ2_S.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-IQ2_XS.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-IQ2_XXS.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-IQ3_M.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-IQ3_S.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-IQ3_XS.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-IQ3_XXS.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-IQ4_NL.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-IQ4_XS.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-Q2_K.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-Q2_K_S.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-Q3_K_L.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-Q3_K_M.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-Q3_K_S.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-Q4_0.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-Q4_1.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-Q4_K_M.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-Q4_K_S.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-Q5_K_M.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-Q5_K_S.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.i1-Q6_K.ggufLFS	uploaded from nico1	1 个月前
Vero-Qwen3I-8B.imatrix.ggufLFS	uploaded from nico1	1 个月前

自动翻译

base_model: zlab-princeton/Vero-Qwen3I-8B language:

en library_name: transformers license: apache-2.0 mradermacher: readme_rev: 1 quantized_by: mradermacher tags:
vero
vision-language-model
multimodal
visual-reasoning
reinforcement-learning

关于

https://huggingface.co/zlab-princeton/Vero-Qwen3I-8B 的加权/矩阵量化版本

如需便捷概览和下载列表，请访问我们的该模型专属页面。

静态量化版本可在 https://huggingface.co/mradermacher/Vero-Qwen3I-8B-GGUF 获取。

这是一个视觉模型——mmproj 文件（如有）将位于静态仓库中。

使用方法

若您不确定如何使用 GGUF 文件，请参考 TheBloke 的任一 README 以获取更多详情，包括如何拼接多部分文件。

提供的量化版本

（按大小排序，而非质量。IQ 量化版本通常优于同等大小的非 IQ 量化版本）

链接	类型	大小/GB	说明
GGUF	imatrix	0.1	矩阵文件（用于创建您自己的量化版本）
GGUF	i1-IQ1_S	2.2	适用于存储空间极度紧张的情况
GGUF	i1-IQ1_M	2.4	大多适用于存储空间紧张的情况
GGUF	i1-IQ2_XXS	2.6
GGUF	i1-IQ2_XS	2.8
GGUF	i1-IQ2_S	3.0
GGUF	i1-IQ2_M	3.2
GGUF	i1-Q2_K_S	3.2	质量极低
GGUF	i1-Q2_K	3.4	IQ3_XXS 可能更优
GGUF	i1-IQ3_XXS	3.5	质量较低
GGUF	i1-IQ3_XS	3.7
GGUF	i1-Q3_K_S	3.9	IQ3_XS 可能更优
GGUF	i1-IQ3_S	3.9	优于 Q3_K*
GGUF	i1-IQ3_M	4.0
GGUF	i1-Q3_K_M	4.2	IQ3_S 可能更优
GGUF	i1-Q3_K_L	4.5	IQ3_M 可能更优
GGUF	i1-IQ4_XS	4.7
GGUF	i1-Q4_0	4.9	速度快，质量低
GGUF	i1-IQ4_NL	4.9	推荐优先选择 IQ4_XS
GGUF	i1-Q4_K_S	4.9	尺寸/速度/质量平衡最优
GGUF	i1-Q4_K_M	5.1	速度快，推荐使用
GGUF	i1-Q4_1	5.3
GGUF	i1-Q5_K_S	5.8
GGUF	i1-Q5_K_M	6.0
GGUF	i1-Q6_K	6.8	实际效果接近静态 Q6_K