Qwen3-32B-Nex-N1:基于 HuggingFace 生态的 AI 智能体项目

可用于构建和部署 AI 智能体,助力提升编程、工具使用、网页搜索等多任务效率。项目具备全谱模型矩阵、聚焦智能体性能、生产级实用性及端到端控制等亮点。【此简介由AI生成】

分支1Tags0
Wwangguotengupdate tech report
123d924c创建于 2025年12月5日10次提交
文件最后提交记录最后更新时间
update tech report 5 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
update tech report 5 个月前
update tech report 5 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Update chat_template.jinja6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
System init configuration.json6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前
Upload to nex-agi/Qwen3-32B-Nex-N1 on ModelScope hub6 个月前

license: apache-2.0


🏠 首页   |    🤗 模型   |    🤗 数据   |    📑 技术报告  

Nex-N1

Nex 是下一代全栈智能体平台,将基础模型、合成数据管道、强化学习训练、智能体框架和部署工具整合到一个统一的生态系统中。 DeepSeek-V3.1-Nex-N1 是 Nex-N1 系列的旗舰版本——这是一款经过后训练的模型,旨在突出智能体自主性、工具使用能力和现实世界生产力。 我们致力于通过为研究人员和企业家提供高性能、可靠且经济高效的“开箱即用”智能体系统,让构建和部署 AI 智能体比以往任何时候都更加容易。

亮点

  • 全谱系模型矩阵:从 80 亿到 6710 亿参数,Nex 系列涵盖了从边缘友好型配置到前沿规模部署的各种需求。
  • 聚焦智能体性能:在编程、工具使用、网络搜索和其他多步推理任务上展现行业领先成果。
  • 生产级实用性:擅长小程序开发、网站创作、幻灯片制作和沉浸式角色扮演,可立即提升生产力。
  • 端到端控制:开发人员可以在 Nex 基础上构建从数据到部署的完整流程,确保自主性的同时保持成本可预测。
  • 开放生态系统:现成的合成数据管道、精选数据集、Nex-N1 检查点、NexAU 智能体框架、EaaS MoE 推理栈以及 NexRL 训练服务均开放可用。

性能

Nex-N1 在六个代表性智能体基准测试(通用 + 专业)上进行了评估。该模型在工具使用、网络搜索和重度编码评估中始终名列前茅,显示出对现实世界智能体工作流的强大适应性。

Nex-N1 Benchmark Overview

  • 数据点默认来源于模型的官方技术报告或博客,以及基准测试的官方结果。所有其他指标均严格按照官方标准评估框架进行测试。
  • Tau2-bench 的结果通过加权平均得出。
  • 对于 SWE-verified-bench,测试结果基于使用 OpenHands 构建的内部框架——采用 128k 上下文长度和最多 150 步,并取四次运行的平均值。
  • Terminal-Bench2 使用官方 Terminus2 智能体进行评估。

Nex-N1 提供从 80 亿到 6710 亿参数的多种规模模型,以适应不同的使用场景。

模型 GAIA2 τ2-Bench SWE-bench Verified Terminal-Bench2 BaxBench BFCL v4
DeepSeek-V3.1-Nex-N1 29.5 80.2 70.6 31.8 59.7 65.3
Qwen3-32B-Nex-N1 16.7 72.1 50.5 16.7 34.8 60.5
Qwen3-30B-A3B-Nex-N1 11.3 65.3 29.7 8.3 13.6 51.9
internlm3-8B-Nex-N1 8.6 63.0 20.3 - - 44.5

Nex-N1 在所有评估场景中均表现出竞争力,尤其在实际编码和 HTML 生成任务中成果显著。

实际编码评估
HTML 生成评估

更多详情请参见 https://huggingface.co/datasets/nex-agi/coding-evalhttps://huggingface.co/datasets/nex-agi/html-eval

使用方法

本地部署

我们建议使用 sglang 在本地部署 Nex 系列模型:

python -m sglang.launch_server --model-path /path/to/your/model

函数调用

Nex系列模型支持强大的函数调用能力。为了充分发挥Nex系列模型的函数调用性能,我们对qwen3_coder的工具解析器进行了优化,具体可参考:https://github.com/sgl-project/sglang/pull/13411。若要启用此功能,在启动服务器时只需添加--tool-call-parser qwen3_coder参数即可:

python -m sglang.launch_server --model-path /path/to/your/model --tool-call-parser qwen3_coder

小程序开发

Nex-N1 针对小程序开发进行了优化。为获得最佳性能,建议使用同时配置了 context7 和搜索 MCP 的 Claude Code。

claude mcp add --transport http context7 https://mcp.context7.com/mcp --header "CONTEXT7_API_KEY: [CONTEXT7_API_KEY]"

claude mcp add --transport stdio serper-search --env SERPER_API_KEY=[SERPER_API_KEY]  -- npx -y serper-search-scrape-mcp-server

有关 context7 的设置详情,请参阅 https://github.com/upstash/context7

项目介绍

可用于构建和部署 AI 智能体,助力提升编程、工具使用、网页搜索等多任务效率。项目具备全谱模型矩阵、聚焦智能体性能、生产级实用性及端到端控制等亮点。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新

语言类型

Jinja100%