AgentSDK example
AgentSDK 提供分层解耦昇腾亲和的企业级智能体Agentic RL训推框架,帮助用户快速训练AI智能体。 这里提供agent实现参考用例和不同agent执行引擎的实现参考用例,便于快速接入agent。
主要目录结构与说明
| 目录 | 说明 |
|---|---|
| agents | 提供Agent实现参考样例,包括 math agent 和 websearcher agent |
| langgraph | 提供agent引擎langgraph的参考样例,实现 LangGraph 与 AgentSDK 对接 |
| meta-are | 提供agent引擎Meta ARE的参考样例,实现 Meta ARE 与 AgentSDK 对接 |
| rllm | 提供agent引擎rllm的参考样例,实现 rLLM 与 AgentSDK 对接 |
agents 目录
提供 Agent 实现参考样例,包含以下子目录:
| 子目录 | 说明 |
|---|---|
| math_agent | 数学推理智能体,基于 rLLM ToolAgent 实现,用于数学领域的问题求解 |
| websearcher | 网络搜索智能体,支持多轮搜索、上下文压缩和本地RAG检索服务 |
langgraph 目录
提供 LangGraph 流程编排工具与 AgentSDK 对接的参考样例。通过 LangGraphEngineWrapper 类实现 BaseEngineWrapper 抽象接口,展示如何将 LangGraph 构建的 Agent 接入 AgentSDK 的训练流程。
meta-are 目录
提供 Meta ARE与 AgentSDK 对接的参考样例。展示在 websearcher 场景下,使用 GAIA2 数据集(search 子集)上的 GRPO 训练示例。
rllm 目录
提供 rLLM 与 AgentSDK 对接的参考样例。通过 RllmEngineWrapper 类实现 BaseEngineWrapper 抽象接口,支持两种运行模式:
- Token 模式:一次性生成完整轨迹,计算整个轨迹的advantage
- Step 模式:逐步生成轨迹数据,计算每个step的step-wise advantage