Layris_9B-GGUF-IQ-Imatrix:基于Imatrix技术的高质量量化模型,支持多场景文本生成

采用Imatrix技术提升量化质量,提供多种量化选项,减少拒绝率,适合角色扮演等文本生成场景,基于ChaoticNeutrals/Layris_9B模型转换。【此简介由AI生成】

分支1Tags0

library_name: transformers tags:

  • mistral
  • quantized
  • text-generation-inference
  • roleplay

- rp

- uncensored

pipeline_tag: text-generation inference: false

language:

- en

FILL THE INFORMATION:

Reference: ChaoticNeutrals/Layris_9B

Author: ChaoticNeutrals

Model: Layris_9B

Llama.cpp version: b2350


Tip

支持说明:
近期我的上传速度一直不稳定且表现不佳。
实际上我需要更换更好的网络服务提供商才能解决。
如果您愿意并且有能力的话...
可以在这里支持我的多项工作(Ko-fi 打赏)。
很抱歉给您的体验带来干扰。

    quantization_options = [
        "Q4_K_M", "Q4_K_S", "IQ4_XS", "Q5_K_M", 
        "Q5_K_S", "Q6_K", "Q8_0", "IQ3_M", "IQ3_S", "IQ3_XS", "IQ3_XXS"
    ]

针对 ChaoticNeutrals/Layris_9B 的 GGUF-Imatrix 量化版本

所有荣誉归原作者所有。

若您欣赏此作品,欢迎探索 FantasiaFoundry 的 GGUF-IQ-Imatrix 量化脚本 的相关工作。

个人说明:
由于此模型与无限制版本 Layla-V4 进行了融合,预计会显著降低拒绝响应率。

何为 "Imatrix"?

它代表重要性矩阵(Importance Matrix)——一种用于提升量化模型质量的技术。

[1]

该矩阵基于校准数据计算生成,通过在量化过程中识别不同模型激活值的重要性,优先保留关键信息。这种方法能有效降低模型性能损耗,尤其在采用多样化校准数据时,可显著提升量化后模型的输出质量。

[2]

本次量化使用的重要性矩阵数据包含在 imatrix.dat 文件中。

基于 llama.cpp-b2350 版本生成:

Base⇢ GGUF(F16)⇢ Imatrix-Data(F16)⇢ GGUF(Imatrix-Quants)

全新的 IQ3_S 量化选项已被证实优于旧的 Q3_K_S 方案,因此我选择采用前者替代后者。该功能仅支持 koboldcpp-1.59.1 及以上版本。

如需添加特定量化方案,欢迎随时提出需求。

模型卡片:

image/jpeg

原始模型信息:

Layris

image/jpeg

本模型是通过 mergekit 工具融合多个预训练语言模型而成的混合模型。

融合详情

融合方法

本模型采用直通融合法(passthrough merge method)进行构建。

融合模型

本次融合包含以下模型:

配置参数

生成此模型所使用的 YAML 配置如下:

slices:
  - sources:
      - model: ChaoticNeutrals/Eris_Remix_7B
        layer_range: [0, 20]
  - sources:
      - model: l3utterfly/mistral-7b-v0.1-layla-v4
        layer_range: [12, 32]
merge_method: passthrough
dtype: float16

项目介绍

采用Imatrix技术提升量化质量,提供多种量化选项,减少拒绝率,适合角色扮演等文本生成场景,基于ChaoticNeutrals/Layris_9B模型转换。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新