需求文档

1. 应用概述

1.1 应用名称

金融分析Agent系统

1.2 应用描述

基于五层架构的财务报告自动分析流水线Web应用,实现从文档摄入到分析报告生成的全流程自动化处理。系统通过OCR识别、数据提取、指标计算、AI推理和知识库支撑,完成财务报告的结构化分析与风险识别。


2. 用户与使用场景

2.1 目标用户

  • 财务分析师

  • 风险评估人员

  • 金融机构研究员

2.2 核心使用场景

  • 上传财务报告文档(扫描件、照片、电子档),系统自动完成OCR识别、数据提取、指标计算、AI分析,最终生成结构化财务分析报告

  • 配置OCR模型API和文本模型API,适配不同业务需求

  • 实时监控五层流水线处理进度,定位异常环节

  • 下载生成的分析报告文件


3. 页面结构与功能说明

3.1 页面结构

金融分析Agent系统
├── 首页(文档上传与配置)
├── 流水线监控页
└── 报告下载页

3.2 功能说明

3.2.1 首页(文档上传与配置)

文档上传功能

  • 支持上传财务报告文档(扫描件、照片、电子档),单文件大小支持几十MB

  • 上传后触发五层流水线处理

OCR模型API配置功能

  • 用户输入OCR模型API地址、密钥等配置信息

  • 保存配置后,系统在第一层(文档摄入层)调用该API进行OCR识别

文本模型API配置功能

  • 用户输入文本大模型API地址、密钥等配置信息

  • 保存配置后,系统在第四层(大模型推理层)调用该API进行AI推理

响应式设计

  • 页面适配横屏和竖屏显示

3.2.2 流水线监控页

五层流水线可视化展示

  • 展示五层架构:第一层(文档摄入层)、第二层(信息和数据提取层)、第三层(财务指标和风险信号计算层)、第四层(大模型推理层)、第五层(知识库层)

  • 每层显示当前处理状态(待处理/处理中/已完成/异常)

实时进度显示

  • 显示当前处理到哪一层

  • 显示每层的处理进度百分比

  • 显示每层的处理日志(如第一层显示每页是否读取成功、第二层显示数据提取是否达标、第三层显示指标计算结果、第四层显示Agent推理状态、第五层显示知识库调用记录)

异常提示

  • 当某一层处理失败时,显示异常信息和失败原因

  • 提示用户是否需要重新处理

3.2.3 报告下载页

分析报告展示

  • 显示生成的财务分析报告内容

  • 报告包含21项指标、17节报告框架、37个数据槽的分析结果

下载功能

  • 用户点击下载按钮,下载生成的分析报告文件

4. 业务规则与逻辑

4.1 五层架构处理流程

第一层:文档摄入层

  • 接收用户上传的文档

  • 使用Python脚本和Tesseract进行文本识别,识别失败时调用配置的OCR API

  • 记录每页的识别状态(成功/失败)和识别方式(脚本/OCR)

  • 生成完整的摄入日志

第二层:信息和数据提取层

  • 将识别结果转换为结构化数据

  • 提取三张表(资产负债表、利润表、现金流量表)的全貌、关键字段(附注、营收成本、关联交易等)

  • 校验数据完整性,未达标准时阻断流程,返回第一层重新处理

第三层:财务指标和风险信号计算层

  • 基于结构化数据计算21项财务指标

  • 填充17节报告框架的37个数据槽

  • 所有计算基于机械规则,不依赖AI推理

第四层:大模型推理层

  • 角色1:调用脚本,监控异常

  • 角色2:取读数据、查询知识库、执行分析、填充报告(每个财务科目单独召唤一个Agent,读取对应知识库进行推理)

  • 角色3:执行16条验证规则,逐条检查报告质量(收入分类不能自造、判断必须有定量依据、关联交易必须穿透、偿债能力必须专项分析等)

  • 角色4:读取案例,更新知识库内容

  • 验证规则未全部通过时,返回修改直至全部通过

第五层:知识库层

  • 包含43项知识库:行业画像(来自评级报告)、科目分析范式(来自教材和实践经验)、33个案例(来自募集说明书)、监管法条(随时更新)

  • Agents按角色和子任务查询知识库,匹配类似案例和分析范式

  • 支持知识库内容的动态更新

4.2 数据流转逻辑

  • 文档上传 → 第一层识别 → 第二层提取 → 第三层计算 → 第四层推理 → 生成报告

  • 任一层处理失败时,阻断流程并返回上一层重新处理

  • 第四层验证规则未通过时,返回修改直至全部通过


5. 异常与边界情况

异常场景 处理方式
上传文档格式不支持 提示用户上传支持的文档格式
OCR识别失败 记录失败页码,提示用户检查文档质量或更换OCR API
数据提取未达标准 阻断流程,返回第一层重新识别
指标计算缺少必要数据 提示缺少的数据字段,阻断流程
大模型API调用失败 提示用户检查API配置或网络连接
验证规则未通过 显示未通过的规则条目,返回修改
知识库查询无匹配结果 记录查询失败,继续执行后续流程

6. 验收标准

  1. 用户在首页上传一份财务报告文档(扫描件或电子档)
  2. 系统在流水线监控页实时显示五层处理进度和状态
  3. 第一层完成文档识别,生成摄入日志
  4. 第二层完成数据提取,生成结构化数据
  5. 第三层完成21项指标计算和37个数据槽填充
  6. 第四层完成AI推理和16条验证规则检查
  7. 用户在报告下载页查看生成的财务分析报告
  8. 用户点击下载按钮,成功下载分析报告文件

7. 本期不实现功能

  • 用户权限管理与多用户协作

  • 历史报告查询与对比分析

  • 自定义报告模板

  • 批量文档上传与处理

  • 报告导出为多种格式(PDF、Word、Excel等)

  • 知识库的可视化编辑与管理界面

  • 移动端App版本

  • 数据加密与安全审计

  • 多语言支持