Orsta-7B-i1-GGUF:7B视觉模型i1量化版本,支持多模态与强化学习

Orsta-7B的i1量化GGUF版本,为视觉模型提供多种低资源消耗的量化选项,支持多模态任务与强化学习应用,方便高效部署。【此简介由AI生成】

分支1Tags0
11c37852创建于 2025年7月11日33次提交
文件最后提交记录最后更新时间
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
uploaded from nico111 个月前
auto-patch README.md10 个月前
uploaded from nico111 个月前

base_model: One-RL-to-See-Them-All/Orsta-7B datasets:

  • One-RL-to-See-Them-All/Orsta-Data-47k language:
  • en library_name: transformers license: mit mradermacher: readme_rev: 1 quantized_by: mradermacher tags:
  • VLM
  • multimodal
  • reinforcement-learning

关于

https://huggingface.co/One-RL-to-See-Them-All/Orsta-7B 的加权/矩阵量化版本

如需便捷概览和下载列表,请访问我们的该模型页面

静态量化版本可在 https://huggingface.co/mradermacher/Orsta-7B-GGUF 获取

这是一个视觉模型 - mmproj 文件(如有)将位于静态仓库中。

使用方法

如果您不确定如何使用 GGUF 文件,请参考 TheBloke 的 README 文档 以获取更多详细信息,包括如何拼接多部分文件。

提供的量化版本

(按大小排序,不一定按质量排序。IQ 量化版本通常优于同等大小的非 IQ 量化版本)

链接 类型 大小/GB 说明
GGUF i1-IQ1_S 2.0 适用于存储空间极度紧张的情况
GGUF i1-IQ1_M 2.1 主要适用于存储空间紧张的情况
GGUF i1-IQ2_XXS 2.4
GGUF i1-IQ2_XS 2.6
GGUF i1-IQ2_S 2.7
GGUF i1-IQ2_M 2.9
GGUF i1-Q2_K_S 2.9 质量极低
GGUF i1-Q2_K 3.1 IQ3_XXS 可能更好
GGUF i1-IQ3_XXS 3.2 质量较低
GGUF i1-IQ3_XS 3.4
GGUF i1-Q3_K_S 3.6 IQ3_XS 可能更好
GGUF i1-IQ3_S 3.6 优于 Q3_K*
GGUF i1-IQ3_M 3.7
GGUF i1-Q3_K_M 3.9 IQ3_S 可能更好
GGUF i1-Q3_K_L 4.2 IQ3_M 可能更好
GGUF i1-IQ4_XS 4.3
GGUF i1-IQ4_NL 4.5 推荐优先选择 IQ4_XS
GGUF i1-Q4_0 4.5 速度快,质量低
GGUF i1-Q4_K_S 4.6 尺寸/速度/质量平衡最佳
GGUF i1-Q4_K_M 4.8 速度快,推荐使用
GGUF i1-Q4_1 5.0
GGUF i1-Q5_K_S 5.4
GGUF i1-Q5_K_M 5.5
GGUF i1-Q6_K 6.4 实际效果接近静态 Q6_K

以下是 ikawrakow 制作的比较部分低质量量化类型的实用图表(数值越低越好):

image.png

以下是 Artefact2 对此问题的看法: https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9

常见问题 / 模型请求

有关您可能遇到的问题的解答,以及如果您希望对其他模型进行量化处理,请参见 https://huggingface.co/mradermacher/model_requests。

致谢

感谢我的公司 nethype GmbH 允许我使用其服务器,并为我的工作站提供升级,使我能够在业余时间开展这项工作。特别感谢 @nicoboss 提供其私人超级计算机的访问权限,这使我能够提供比原本更多、质量更高的 imatrix 量化版本。

项目介绍

Orsta-7B的i1量化GGUF版本,为视觉模型提供多种低资源消耗的量化选项,支持多模态任务与强化学习应用,方便高效部署。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新