采用Imatrix技术提升量化质量，提供多种量化选项，减少拒绝率，适合角色扮演等文本生成场景，基于ChaoticNeutrals/Layris_9B模型转换。【此简介由AI生成】

147cd41f创建于 2024年5月4日12次提交

文件	最后提交记录	最后更新时间
.gitattributes	Upload 3 files	2 年前
Layris_9B-F16.ggufLFS	Upload 3 files	2 年前
Layris_9B-IQ3_M-imat.ggufLFS	Upload 3 files	2 年前
Layris_9B-IQ3_S-imat.ggufLFS	Upload 3 files	2 年前
Layris_9B-IQ3_XS-imat.ggufLFS	Upload 3 files	2 年前
Layris_9B-IQ3_XXS-imat.ggufLFS	Upload 3 files	2 年前
Layris_9B-IQ4_XS-imat.ggufLFS	Upload 4 files	2 年前
Layris_9B-Q4_K_M-imat.ggufLFS	Upload 4 files	2 年前
Layris_9B-Q4_K_S-imat.ggufLFS	Upload 4 files	2 年前
Layris_9B-Q5_K_M-imat.ggufLFS	Upload 3 files	2 年前
Layris_9B-Q5_K_S-imat.ggufLFS	Upload 3 files	2 年前
Layris_9B-Q6_K-imat.ggufLFS	Upload 3 files	2 年前
Layris_9B-Q8_0-imat.ggufLFS	Upload 3 files	2 年前
README.md	Update README.md	2 年前
imatrix.datLFS	Upload 4 files	2 年前

自动翻译

library_name: transformers tags:

mistral
quantized
text-generation-inference
roleplay

- rp

- uncensored

pipeline_tag: text-generation inference: false

language:

- en

FILL THE INFORMATION:

Reference: ChaoticNeutrals/Layris_9B

Author: ChaoticNeutrals

Model: Layris_9B

Llama.cpp version: b2350

Tip

支持说明：
近期我的上传速度一直不稳定且表现不佳。
实际上我需要更换更好的网络服务提供商才能解决。
如果您愿意并且有能力的话...
可以在这里支持我的多项工作（Ko-fi 打赏）。
很抱歉给您的体验带来干扰。

    quantization_options = [
        "Q4_K_M", "Q4_K_S", "IQ4_XS", "Q5_K_M", 
        "Q5_K_S", "Q6_K", "Q8_0", "IQ3_M", "IQ3_S", "IQ3_XS", "IQ3_XXS"
    ]

针对 ChaoticNeutrals/Layris_9B 的 GGUF-Imatrix 量化版本

所有荣誉归原作者所有。

若您欣赏此作品，欢迎探索 FantasiaFoundry 的 GGUF-IQ-Imatrix 量化脚本的相关工作。

个人说明：
由于此模型与无限制版本 Layla-V4 进行了融合，预计会显著降低拒绝响应率。

何为 "Imatrix"？

它代表重要性矩阵（Importance Matrix）——一种用于提升量化模型质量的技术。

[1]

该矩阵基于校准数据计算生成，通过在量化过程中识别不同模型激活值的重要性，优先保留关键信息。这种方法能有效降低模型性能损耗，尤其在采用多样化校准数据时，可显著提升量化后模型的输出质量。

[2]

本次量化使用的重要性矩阵数据包含在 imatrix.dat 文件中。

基于 llama.cpp-b2350 版本生成：

Base⇢ GGUF(F16)⇢ Imatrix-Data(F16)⇢ GGUF(Imatrix-Quants)

全新的 IQ3_S 量化选项已被证实优于旧的 Q3_K_S 方案，因此我选择采用前者替代后者。该功能仅支持 koboldcpp-1.59.1 及以上版本。

如需添加特定量化方案，欢迎随时提出需求。

模型卡片：

image/jpeg

原始模型信息：

Layris

image/jpeg

本模型是通过 mergekit 工具融合多个预训练语言模型而成的混合模型。

融合详情

融合方法

本模型采用直通融合法（passthrough merge method）进行构建。

融合模型

本次融合包含以下模型：

配置参数

生成此模型所使用的 YAML 配置如下：

slices:
  - sources:
      - model: ChaoticNeutrals/Eris_Remix_7B
        layer_range: [0, 20]
  - sources:
      - model: l3utterfly/mistral-7b-v0.1-layla-v4
        layer_range: [12, 32]
merge_method: passthrough
dtype: float16

项目介绍