需求文档
1. 应用概述
1.1 应用名称
金融分析Agent系统
1.2 应用描述
基于五层架构的财务报告自动分析流水线Web应用,实现从文档摄入到分析报告生成的全流程自动化处理。系统通过OCR识别、数据提取、指标计算、AI推理和知识库支撑,完成财务报告的结构化分析与风险识别。
2. 用户与使用场景
2.1 目标用户
-
财务分析师
-
风险评估人员
-
金融机构研究员
2.2 核心使用场景
-
上传财务报告文档(扫描件、照片、电子档),系统自动完成OCR识别、数据提取、指标计算、AI分析,最终生成结构化财务分析报告
-
配置OCR模型API和文本模型API,适配不同业务需求
-
实时监控五层流水线处理进度,定位异常环节
-
下载生成的分析报告文件
3. 页面结构与功能说明
3.1 页面结构
金融分析Agent系统
├── 首页(文档上传与配置)
├── 流水线监控页
└── 报告下载页
3.2 功能说明
3.2.1 首页(文档上传与配置)
文档上传功能
-
支持上传财务报告文档(扫描件、照片、电子档),单文件大小支持几十MB
-
上传后触发五层流水线处理
OCR模型API配置功能
-
用户输入OCR模型API地址、密钥等配置信息
-
保存配置后,系统在第一层(文档摄入层)调用该API进行OCR识别
文本模型API配置功能
-
用户输入文本大模型API地址、密钥等配置信息
-
保存配置后,系统在第四层(大模型推理层)调用该API进行AI推理
响应式设计
- 页面适配横屏和竖屏显示
3.2.2 流水线监控页
五层流水线可视化展示
-
展示五层架构:第一层(文档摄入层)、第二层(信息和数据提取层)、第三层(财务指标和风险信号计算层)、第四层(大模型推理层)、第五层(知识库层)
-
每层显示当前处理状态(待处理/处理中/已完成/异常)
实时进度显示
-
显示当前处理到哪一层
-
显示每层的处理进度百分比
-
显示每层的处理日志(如第一层显示每页是否读取成功、第二层显示数据提取是否达标、第三层显示指标计算结果、第四层显示Agent推理状态、第五层显示知识库调用记录)
异常提示
-
当某一层处理失败时,显示异常信息和失败原因
-
提示用户是否需要重新处理
3.2.3 报告下载页
分析报告展示
-
显示生成的财务分析报告内容
-
报告包含21项指标、17节报告框架、37个数据槽的分析结果
下载功能
- 用户点击下载按钮,下载生成的分析报告文件
4. 业务规则与逻辑
4.1 五层架构处理流程
第一层:文档摄入层
-
接收用户上传的文档
-
使用Python脚本和Tesseract进行文本识别,识别失败时调用配置的OCR API
-
记录每页的识别状态(成功/失败)和识别方式(脚本/OCR)
-
生成完整的摄入日志
第二层:信息和数据提取层
-
将识别结果转换为结构化数据
-
提取三张表(资产负债表、利润表、现金流量表)的全貌、关键字段(附注、营收成本、关联交易等)
-
校验数据完整性,未达标准时阻断流程,返回第一层重新处理
第三层:财务指标和风险信号计算层
-
基于结构化数据计算21项财务指标
-
填充17节报告框架的37个数据槽
-
所有计算基于机械规则,不依赖AI推理
第四层:大模型推理层
-
角色1:调用脚本,监控异常
-
角色2:取读数据、查询知识库、执行分析、填充报告(每个财务科目单独召唤一个Agent,读取对应知识库进行推理)
-
角色3:执行16条验证规则,逐条检查报告质量(收入分类不能自造、判断必须有定量依据、关联交易必须穿透、偿债能力必须专项分析等)
-
角色4:读取案例,更新知识库内容
-
验证规则未全部通过时,返回修改直至全部通过
第五层:知识库层
-
包含43项知识库:行业画像(来自评级报告)、科目分析范式(来自教材和实践经验)、33个案例(来自募集说明书)、监管法条(随时更新)
-
Agents按角色和子任务查询知识库,匹配类似案例和分析范式
-
支持知识库内容的动态更新
4.2 数据流转逻辑
-
文档上传 → 第一层识别 → 第二层提取 → 第三层计算 → 第四层推理 → 生成报告
-
任一层处理失败时,阻断流程并返回上一层重新处理
-
第四层验证规则未通过时,返回修改直至全部通过
5. 异常与边界情况
| 异常场景 | 处理方式 |
|---|---|
| 上传文档格式不支持 | 提示用户上传支持的文档格式 |
| OCR识别失败 | 记录失败页码,提示用户检查文档质量或更换OCR API |
| 数据提取未达标准 | 阻断流程,返回第一层重新识别 |
| 指标计算缺少必要数据 | 提示缺少的数据字段,阻断流程 |
| 大模型API调用失败 | 提示用户检查API配置或网络连接 |
| 验证规则未通过 | 显示未通过的规则条目,返回修改 |
| 知识库查询无匹配结果 | 记录查询失败,继续执行后续流程 |
6. 验收标准
- 用户在首页上传一份财务报告文档(扫描件或电子档)
- 系统在流水线监控页实时显示五层处理进度和状态
- 第一层完成文档识别,生成摄入日志
- 第二层完成数据提取,生成结构化数据
- 第三层完成21项指标计算和37个数据槽填充
- 第四层完成AI推理和16条验证规则检查
- 用户在报告下载页查看生成的财务分析报告
- 用户点击下载按钮,成功下载分析报告文件
7. 本期不实现功能
-
用户权限管理与多用户协作
-
历史报告查询与对比分析
-
自定义报告模板
-
批量文档上传与处理
-
报告导出为多种格式(PDF、Word、Excel等)
-
知识库的可视化编辑与管理界面
-
移动端App版本
-
数据加密与安全审计
-
多语言支持