Qwen3-14B-ARPO-DeepSearch-i1-GGUF:Qwen3-14B-ARPO-DeepSearch的i1量化版本,支持多种GGUF格式

基于Qwen3-14B-ARPO-DeepSearch模型的i1量化版本,提供多种GGUF格式,适用于不同场景需求,方便高效使用。【此简介由AI生成】

分支2Tags0
4666fb24创建于 2025年8月13日29次提交
文件最后提交记录最后更新时间
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
uploaded from rich19 个月前
auto-patch README.md9 个月前

base_model: dongguanting/Qwen3-14B-ARPO-DeepSearch language:

  • en library_name: transformers license: mit mradermacher: readme_rev: 1 quantized_by: mradermacher tags:
  • agent
  • tool-use
  • reinforcement-learning
  • qwen
  • llm

关于

https://huggingface.co/dongguanting/Qwen3-14B-ARPO-DeepSearch 的加权/矩阵量化版本

如需便捷概览和下载列表,请访问我们的该模型页面

静态量化版本可在 https://huggingface.co/mradermacher/Qwen3-14B-ARPO-DeepSearch-GGUF 获取

使用方法

如果您不确定如何使用 GGUF 文件,请参考 TheBloke 的 README 文档 之一以获取更多详细信息,包括如何拼接多部分文件。

提供的量化版本

(按大小排序,不一定代表质量排序。通常,相同大小的 IQ 量化版本优于非 IQ 量化版本)

链接 类型 大小/GB 说明
GGUF 矩阵文件 0.1 矩阵文件(用于创建您自己的量化版本)
GGUF i1-IQ1_S 3.7 适用于存储空间极度有限的情况
GGUF i1-IQ1_M 3.9 主要适用于存储空间有限的情况
GGUF i1-IQ2_XXS 4.4
GGUF i1-IQ2_XS 4.8
GGUF i1-IQ2_S 5.1
GGUF i1-IQ2_M 5.4
GGUF i1-Q2_K_S 5.5 质量非常低
GGUF i1-Q2_K 5.9 IQ3_XXS 可能更好
GGUF i1-IQ3_XXS 6.0 质量较低
GGUF i1-IQ3_XS 6.5
GGUF i1-Q3_K_S 6.8 IQ3_XS 可能更好
GGUF i1-IQ3_S 6.8 优于 Q3_K*
GGUF i1-IQ3_M 7.0
GGUF i1-Q3_K_M 7.4 IQ3_S 可能更好
GGUF i1-Q3_K_L 8.0 IQ3_M 可能更好
GGUF i1-IQ4_XS 8.2
GGUF i1-IQ4_NL 8.6 优先选择 IQ4_XS
GGUF i1-Q4_0 8.6 速度快,质量低
GGUF i1-Q4_K_S 8.7 尺寸/速度/质量平衡最佳
GGUF i1-Q4_K_M 9.1 速度快,推荐使用
GGUF i1-Q4_1 9.5
GGUF i1-Q5_K_S 10.4
GGUF i1-Q5_K_M 10.6
GGUF i1-Q6_K 12.2 实际上类似于静态 Q6_K

以下是 ikawrakow 制作的比较部分低质量量化类型的实用图表(数值越低越好):

image.png

以下是 Artefact2 对此问题的看法: https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9

常见问题 / 模型请求

有关您可能遇到的问题的解答,以及如果您希望对其他模型进行量化,请参见 https://huggingface.co/mradermacher/model_requests。

致谢

感谢我的公司 nethype GmbH 允许我使用其服务器,并为我的工作站提供升级,使我能够在业余时间开展这项工作。特别感谢 @nicoboss 让我能够访问他的私人超级计算机,这使我能够提供比原本更多、质量更高的 imatrix 量化版本。

项目介绍

基于Qwen3-14B-ARPO-DeepSearch模型的i1量化版本,提供多种GGUF格式,适用于不同场景需求,方便高效使用。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新