HER-32B-absolute-heresy-i1-GGUF:HER-32B-absolute-heresy 的 i1 量化 GGUF 模型

基于 MuXodious/HER-32B-absolute-heresy 的 i1 量化 GGUF 模型，支持多轮对话、角色扮演，提供多种 IQ 和 Q 系列量化版本，满足不同性能需求。【此简介由AI生成】

文件	最后提交记录	最后更新时间
.gitattributes	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-IQ1_M.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-IQ1_S.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-IQ2_M.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-IQ2_S.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-IQ2_XS.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-IQ2_XXS.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-IQ3_M.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-IQ3_S.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-IQ3_XS.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-IQ3_XXS.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-IQ4_XS.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-Q2_K.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-Q2_K_S.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-Q3_K_L.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-Q3_K_M.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-Q3_K_S.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-Q4_0.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-Q4_1.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-Q4_K_M.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-Q4_K_S.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-Q5_K_M.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-Q5_K_S.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.i1-Q6_K.ggufLFS	uploaded from rich1	3 个月前
HER-32B-absolute-heresy.imatrix.ggufLFS	uploaded from rich1	3 个月前
README.md	auto-patch README.md	3 个月前

自动翻译

base_model: MuXodious/HER-32B-absolute-heresy language:

zh
en library_name: transformers license: apache-2.0 mradermacher: readme_rev: 1 quantized_by: mradermacher tags:
roleplay
dialogue
multi-turn
qwen
reinforcement-learning
chat
heretic
uncensored
decensored
abliterated

关于

https://huggingface.co/MuXodious/HER-32B-absolute-heresy 的加权/矩阵量化版本

如需便捷概览和下载列表，请访问我们的该模型页面。

静态量化版本可在 https://huggingface.co/mradermacher/HER-32B-absolute-heresy-GGUF 获取

使用方法

如果您不确定如何使用GGUF文件，请参考TheBloke的READMEs中的相关内容，了解更多详细信息，包括如何合并多部分文件。

提供的量化版本

（按大小排序，而非质量排序。通常，IQ量化版本优于同等大小的非IQ量化版本）

链接	类型	大小/GB	说明
GGUF	矩阵文件	0.1	矩阵文件（用于创建您自己的量化版本）
GGUF	i1-IQ1_S	7.4	适用于存储空间极度紧张的情况
GGUF	i1-IQ1_M	8.1	主要适用于存储空间紧张的情况
GGUF	i1-IQ2_XXS	9.1
GGUF	i1-IQ2_XS	10.1
GGUF	i1-IQ2_S	10.6
GGUF	i1-IQ2_M	11.5
GGUF	i1-Q2_K_S	11.6	质量极低
GGUF	i1-Q2_K	12.4	IQ3_XXS 可能更好
GGUF	i1-IQ3_XXS	12.9	质量较低
GGUF	i1-IQ3_XS	13.8
GGUF	i1-Q3_K_S	14.5	IQ3_XS 可能更好
GGUF	i1-IQ3_S	14.5	优于 Q3_K*
GGUF	i1-IQ3_M	15.0
GGUF	i1-Q3_K_M	16.1	IQ3_S 可能更好
GGUF	i1-Q3_K_L	17.4	IQ3_M 可能更好
GGUF	i1-IQ4_XS	17.8
GGUF	i1-Q4_0	18.8	速度快，质量低
GGUF	i1-Q4_K_S	18.9	尺寸/速度/质量的最佳平衡
GGUF	i1-Q4_K_M	19.9	速度快，推荐使用
GGUF	i1-Q4_1	20.7
GGUF	i1-Q5_K_S	22.7
GGUF	i1-Q5_K_M	23.3
GGUF	i1-Q6_K	27.0	实际效果接近静态 Q6_K