这个开源项目基于LayoutLM架构,专为文档视觉问答和结构化信息提取而优化。它能够理解扫描文档中的文本、布局和视觉元素,适用于发票、表格等复杂文档的智能解析。模型在S2VL数据集上精调,具备出色的多模态推理能力,可广泛应用于自动化办公、金融单据处理等场景,提升文档数字化效率。【此简介由AI生成】
项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新