可用于文本生成、图像理解和视频处理等场景，是基于Gemma 4 26B-A4B-it微调的多模态模型，采用PRISM-PRO动态量化技术，移除了偏见和过度拒绝机制，支持长上下文处理。【此简介由AI生成】

SsystemUpload vision projector mmproj (F16)

文件	最后提交记录	最后更新时间
.gitattributes	Upload vision projector mmproj (F16)	1 个月前
README.md	Update README.md	1 个月前
mmproj-mythos-26b-a4b-prism-pro.ggufLFS	Upload vision projector mmproj (F16)	1 个月前
mythos-26b-a4b-prism-pro-dq.ggufLFS	Upload MYTHOS-26B-A4B language model GGUF (5.73 BPW)	1 个月前

自动翻译

license: apache-2.0 base_model: google/gemma-4-26B-A4B-it base_model_relation: finetune tags:

gemma4
gemma
google
gguf
moe
mixture-of-experts
zero-refusals
prism-dq
dynamic-quantization
multimodal
vision
video-text-to-text
image-text-to-text
abliterated
text-generation language:
en pipeline_tag: image-text-to-text library_name: llama.cpp quantized_by: Ex0bit

MYTHOS-26B-A4B — PRISM 动态量化 (GGUF)

Gemma 4 26B-A4B MoE PRISM-PRO-Dynamic-Quant

PRISM-PRO：生产级模型，采用最先进的PRISM 流水线，完全移除了过度拒绝和偏见机制。
DQ：基于权重结构敏感性分析得出的逐张量类别混合精度分配——而非封闭门控数据集。

由 Ex0bit 创建

💡 支持我的研发工作。会员可在第 0 天获取最新的 PRISM-PRO 模型

模型详情

属性	值
基础模型	google/gemma-4-26B-A4B-it
架构	Gemma 4 MoE（128 个专家，top-8 路由）
参数	总计 260 亿 / 每 token 激活 40 亿
量化方式	PRISM-PRO-DYNAMIC-QUANT
实现 BPW	5.73
文件大小	~17 GB（语言）+ ~1.2 GB（视觉投影器）
上下文长度	262,144 个 token
模态	文本、图像、视频
创建者	Ex0bit

支持的模态

文本：完整的指令跟随和对话功能
图像：通过 SigLIP 编码器实现视觉理解（每幅图像 280 个软 token）
视频：Gemma4VideoProcessor（32 帧，池化处理）

注意：此 260 亿参数 MoE 变体不包含音频支持。如需音频功能，请查看 310 亿参数密集型变体。

文件

文件	大小	用途
`mythos-26b-a4b-prism-pro-dq.gguf`	17 GB	语言模型（已量化）
`mmproj-mythos-26b-a4b-prism-pro.gguf`	1.2 GB	视觉投影器（F16）

多模态推理需要这两个文件。仅文本使用时，只需语言模型文件。

PRISM-DQ 量化

该模型采用PRISM-PRO 动态量化技术——这是一种按张量类别分配混合精度的方法，会根据权重结构的敏感度为不同的张量类别分配不同的量化类型。

与均匀量化（Q4_K_M、Q5_K_M）不同，PRISM-DQ 会分析每个张量类别的敏感度，并在最关键的地方分配精度。注意力投影层会获得比 FFN 层更高的精度，同时通过块级覆盖保护关键层。

结果：以 5.73 位/权重实现了与 BF16 相当的质量——尺寸减少 64%，且无可测量的质量损失。

使用方法

llama.cpp（带视觉功能的多模态）

llama-mtmd-cli \
  --model mythos-26b-a4b-prism-pro-dq.gguf \
  --mmproj mmproj-mythos-26b-a4b-prism-pro.gguf \
  --image path/to/image.jpg \
  --prompt "Describe this image." \
  -ngl 99

llama.cpp（纯文本服务器）

llama-server \
  --model mythos-26b-a4b-prism-pro-dq.gguf \
  --port 8080 -ngl 99

LM Studio

请同时下载 mythos-26b-a4b-prism-pro-dq.gguf 和 mmproj-mythos-26b-a4b-prism-pro.gguf。LM Studio 将自动检测用于多模态聊天的视觉投影器。

拒绝与偏见移除

本模型通过最先进的 PRISM 流水线对基础模型 google/gemma-4-26B-A4B-it 进行了处理，以消除其中的偏见、过度拒绝和宣传内容。

许可证

Apache 2.0（继承自 google/gemma-4-26B-A4B-it）

致谢

创建者：Ex0bit
基础模型：Google DeepMind
量化引擎：PRISM-DQ，由 Ex0bit 开发

项目介绍

下载使用量

项目总下载次数（含Clone、Pull、 zip 包及 release 下载），每日凌晨更新

MYTHOS-26B-A4B-PRISM-PRO-DQ-GGUF:基于Gemma 4生态的多模态文本生成项目