HER-32B-absolute-heresy-i1-GGUF:HER-32B-absolute-heresy 的 i1 量化 GGUF 模型

基于 MuXodious/HER-32B-absolute-heresy 的 i1 量化 GGUF 模型,支持多轮对话、角色扮演,提供多种 IQ 和 Q 系列量化版本,满足不同性能需求。【此简介由AI生成】

分支1Tags0
c75678a4创建于 2月16日32次提交
文件最后提交记录最后更新时间
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
uploaded from rich13 个月前
auto-patch README.md3 个月前

base_model: MuXodious/HER-32B-absolute-heresy language:

  • zh
  • en library_name: transformers license: apache-2.0 mradermacher: readme_rev: 1 quantized_by: mradermacher tags:
  • roleplay
  • dialogue
  • multi-turn
  • qwen
  • reinforcement-learning
  • chat
  • heretic
  • uncensored
  • decensored
  • abliterated

关于

https://huggingface.co/MuXodious/HER-32B-absolute-heresy 的加权/矩阵量化版本

如需便捷概览和下载列表,请访问我们的该模型页面

静态量化版本可在 https://huggingface.co/mradermacher/HER-32B-absolute-heresy-GGUF 获取

使用方法

如果您不确定如何使用GGUF文件,请参考TheBloke的READMEs中的相关内容,了解更多详细信息,包括如何合并多部分文件。

提供的量化版本

(按大小排序,而非质量排序。通常,IQ量化版本优于同等大小的非IQ量化版本)

链接 类型 大小/GB 说明
GGUF 矩阵文件 0.1 矩阵文件(用于创建您自己的量化版本)
GGUF i1-IQ1_S 7.4 适用于存储空间极度紧张的情况
GGUF i1-IQ1_M 8.1 主要适用于存储空间紧张的情况
GGUF i1-IQ2_XXS 9.1
GGUF i1-IQ2_XS 10.1
GGUF i1-IQ2_S 10.6
GGUF i1-IQ2_M 11.5
GGUF i1-Q2_K_S 11.6 质量极低
GGUF i1-Q2_K 12.4 IQ3_XXS 可能更好
GGUF i1-IQ3_XXS 12.9 质量较低
GGUF i1-IQ3_XS 13.8
GGUF i1-Q3_K_S 14.5 IQ3_XS 可能更好
GGUF i1-IQ3_S 14.5 优于 Q3_K*
GGUF i1-IQ3_M 15.0
GGUF i1-Q3_K_M 16.1 IQ3_S 可能更好
GGUF i1-Q3_K_L 17.4 IQ3_M 可能更好
GGUF i1-IQ4_XS 17.8
GGUF i1-Q4_0 18.8 速度快,质量低
GGUF i1-Q4_K_S 18.9 尺寸/速度/质量的最佳平衡
GGUF i1-Q4_K_M 19.9 速度快,推荐使用
GGUF i1-Q4_1 20.7
GGUF i1-Q5_K_S 22.7
GGUF i1-Q5_K_M 23.3
GGUF i1-Q6_K 27.0 实际效果接近静态 Q6_K

以下是ikawrakow制作的比较部分低质量量化类型的实用图表(数值越低越好):

image.png

以下是Artefact2对此问题的看法: https://gist.github.com/Artefact2/b5f810600771265fc1e39442288e8ec9

常见问题 / 模型请求

有关您可能存在的疑问,以及如果您希望对其他模型进行量化处理,请参阅 https://huggingface.co/mradermacher/model_requests。

致谢

感谢我的公司 nethype GmbH 允许我使用其服务器,并为我的工作站提供升级,使我能够在业余时间完成这项工作。特别感谢 @nicoboss 提供其私人超级计算机的访问权限,这让我能够提供比原本更多、质量更高的 imatrix 量化版本。

项目介绍

基于 MuXodious/HER-32B-absolute-heresy 的 i1 量化 GGUF 模型,支持多轮对话、角色扮演,提供多种 IQ 和 Q 系列量化版本,满足不同性能需求。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新