可用于需要无限制内容生成的场景,提供文本、图像、视频等多模态处理能力。该项目基于Qwen3.5-35B-A3B,去除内容审查机制,保留原模型功能,支持多种量化格式和长上下文处理。【此简介由AI生成】
以下内容由 AI 翻译,如有问题请 点此提交 issue 反馈
license: apache-2.0 tags:
- uncensored
- qwen3.5
- moe
- gguf
- vision
- multimodal language:
- en
- zh
- multilingual pipeline_tag: image-text-to-text base_model: Qwen/Qwen3.5-35B-A3B
Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive
加入Discord 获取更新、路线图、项目信息,或单纯交流。
Qwen3.5-35B-A3B 由 HauhauCS 进行无审查处理。0/465 拒绝率。
关于
未对数据集或功能进行任何修改。完全功能正常,保留原始作者设计的 100% 功能——仅移除了拒绝机制。
这些模型旨在成为目前最佳的无损无审查模型。
激进版本
更强的无审查处理——模型完全解锁,不会拒绝任何提示词。偶尔可能会附加简短的免责声明(这是基础模型训练时内置的,不属于拒绝回复),但始终会生成完整内容。
如需保留部分安全防护机制的保守型无审查版本,请关注即将推出的平衡版本。
下载
| 文件 | 量化格式 | 大小 |
|---|---|---|
| Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-BF16.gguf | BF16 | 65 GB |
| Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-Q8_0.gguf | Q8_0 | 35 GB |
| Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-Q6_K.gguf | Q6_K | 27 GB |
| Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-Q5_K_M.gguf | Q5_K_M | 24 GB |
| Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_M.gguf | Q4_K_M | 20 GB |
| Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-IQ4_XS.gguf | IQ4_XS | 18 GB |
| Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-Q3_K_M.gguf | Q3_K_M | 16 GB |
| Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-IQ3_M.gguf | IQ3_M | 15 GB |
| Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-IQ2_M.gguf | IQ2_M | 11 GB |
| mmproj-Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-f16.gguf | mmproj (f16) | 858 MB |
所有量化版本均使用重要性矩阵(imatrix)生成,以在权重调整后实现最佳质量保留。
规格说明
- 总参数350亿,每次前向传播约激活30亿参数(MoE架构)
- 256个专家,每个token路由至8个专家并共享1个专家
- 混合架构:门控DeltaNet线性注意力 + 全softmax注意力(比例3:1)
- 40层,结构模式:10×(3×DeltaNet-MoE + 1×Attention-MoE)
- 原生上下文长度262K(可通过YaRN扩展至1M)
- 原生多模态支持(文本、图像、视频)
- 支持多token预测(MTP)
- 248K词汇量,支持201种语言
- 基于Qwen/Qwen3.5-35B-A3B
推荐设置
来自Qwen官方作者:
思考模式(默认):
- 通用场景:
temperature=1.0, top_p=0.95, top_k=20, min_p=0, presence_penalty=1.5 - 编码/精确任务:
temperature=0.6, top_p=0.95, top_k=20, min_p=0, presence_penalty=0
非思考模式:
- 通用场景:
temperature=0.7, top_p=0.8, top_k=20, min_p=0, presence_penalty=1.5 - 推理任务:
temperature=1.0, top_p=1.0, top_k=40, min_p=0, presence_penalty=2.0
重要提示:
- 至少保留128K上下文以维持思考能力
- 在llama.cpp中使用
--jinja标志以正确处理聊天模板 - 视觉支持需要
mmproj文件与主GGUF文件一同使用
使用方法
适用于llama.cpp、LM Studio、Jan、koboldcpp及其他GGUF兼容运行时。
# Text only
llama-cli -m Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_M.gguf \
--jinja -c 131072 -ngl 99
# With vision
llama-cli -m Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_M.gguf \
--mmproj mmproj-Qwen3.5-35B-A3B-Uncensored-HauhauCS-Aggressive-f16.gguf \
--jinja -c 131072 -ngl 99
注意: LM Studio 的参数列可能显示为 256x2.6B,而非 35B-A3B——这是元数据显示上的小问题,模型可正常运行。
其他格式
- GGUF(本仓库)
- GPTQ — 即将推出