AgentCPM-Explore 标志

【中文 | English

最新消息

  • [2026-01-12] 🚀🚀🚀我们开源了基于全量仅4B参数的智能体大模型AgentCPM-Explore及其所有训练、推理、工具沙盒环境代码,成功闯入GAIA、HLE、BrowseComp等8个经典长难智能体任务榜单,同级别SOTA的表现带来更长行为链路、更准确的深度调研能力,由此突破端侧智能体的性能壁垒。

概述

AgentCPM 是由清华大学自然语言处理实验室(THUNLP)、中国人民大学、面壁智能以及OpenBMB社区联合开发的一系列开源大语言模型智能体。针对智能体在真实世界应用时所面临的长程性、自主性、泛化性不足的问题,提出一系列模型构建方案。团队近期聚焦于先对智能体的深度研究能力进行全方位构建,发布AgentCPM-Explore深度搜索大语言模型智能体与AgentCPM-Report深度调研大语言模型智能体。

模型列表

模型 下载链接 开源内容 技术报告
AgentCPM-Explore 🤗 Hugging Face
🤖 ModelScope
AgentDock: 工具沙盒环境统一管理调度平台
AgentRL: 全异步智能体强化学习框架
AgentToLeaP: 智能体工具学习能力一键测评框架
即将发布

AgentCPM-Explore

简介

AgentCPM-Explore 拥有 40 亿参数,取得同尺寸模型SOTA、越级赶上甚至超越两倍大参数量(8B级)SOTA模型、比肩部分30B级以上和闭源大模型的效果,实现了更长的行为链路和更准确的深度调研(Deep Research)能力,真正让大模型的长程任务处理能力有望部署于端侧,加速私有化智能助手的普及。AgentCPM-Explore的亮点包括:

  • 首个以 4B 全量参数登上 GAIA、HLE、BrowseComp 等 8 个长程复杂智能体任务榜单的端侧智能体模型。

  • 可实现超过 100 轮的连续环境交互,支持多源信息交叉验证、搜索策略动态调整、实时核验最新信息,持续深度探索直至任务完成。

  • 全流程开源,包括智能体全异步强化学习训练框架AgentRL、工具沙盒统一管理调度平台AgentDock、智能体工具学习能力一键测评平台AgentToLeaP,支持社区共建与自定义扩展。

开源协议

  • 本仓库开源的代码遵照 Apache-2.0 协议。

更多项目