【中文 | English】

概述

AgentCPM 是由清华大学自然语言处理实验室（THUNLP）、中国人民大学、面壁智能以及OpenBMB社区联合开发的一系列开源大语言模型智能体。针对智能体在真实世界应用时所面临的长程性、自主性、泛化性不足的问题，提出一系列模型构建方案。团队近期聚焦于先对智能体的深度研究能力进行全方位构建，发布AgentCPM-Explore深度搜索大语言模型智能体与AgentCPM-Report深度调研大语言模型智能体。

模型列表

模型	下载链接	开源内容	技术报告
AgentCPM-Explore	🤗 Hugging Face 🤖 ModelScope	AgentDock: 工具沙盒环境统一管理调度平台 AgentRL: 全异步智能体强化学习框架 AgentToLeaP: 智能体工具学习能力一键测评框架	即将发布

AgentCPM-Explore

简介

AgentCPM-Explore 拥有 40 亿参数，取得同尺寸模型SOTA、越级赶上甚至超越两倍大参数量（8B级）SOTA模型、比肩部分30B级以上和闭源大模型的效果，实现了更长的行为链路和更准确的深度调研（Deep Research）能力，真正让大模型的长程任务处理能力有望部署于端侧，加速私有化智能助手的普及。AgentCPM-Explore的亮点包括：

首个以 4B 全量参数登上 GAIA、HLE、BrowseComp 等 8 个长程复杂智能体任务榜单的端侧智能体模型。
可实现超过 100 轮的连续环境交互，支持多源信息交叉验证、搜索策略动态调整、实时核验最新信息，持续深度探索直至任务完成。
全流程开源，包括智能体全异步强化学习训练框架AgentRL、工具沙盒统一管理调度平台AgentDock、智能体工具学习能力一键测评平台AgentToLeaP，支持社区共建与自定义扩展。

开源协议

本仓库开源的代码遵照 Apache-2.0 协议。

最新消息

概述

模型列表

AgentCPM-Explore

简介

开源协议

更多项目