ivila-row-layoutlm-finetuned-s2vl-v2:这个开源项目基于LayoutLM架构,专为文档视觉问答和结构化信息提取而优化。它能够理解扫描文档中的文本、布局和视觉元素,适用于发票、表格等复杂文档的智能解析。模型在S2VL数据集上精调,具备出色的多模态推理能力,可广泛应用于自动化办公、金融单据处理等场景,提升文档数字化效率。【此简介由AI生成】

这个开源项目基于LayoutLM架构,专为文档视觉问答和结构化信息提取而优化。它能够理解扫描文档中的文本、布局和视觉元素,适用于发票、表格等复杂文档的智能解析。模型在S2VL数据集上精调,具备出色的多模态推理能力,可广泛应用于自动化办公、金融单据处理等场景,提升文档数字化效率。【此简介由AI生成】

分支1Tags0
文件最后提交记录最后更新时间
initial commit3 年前
Upload README.md with huggingface_hub (#1) - Upload README.md with huggingface_hub (92ccd901eb08c131821d4433081f95c630fb11a3) Co-authored-by: Loïck BOURDOIS <lbourdois@users.noreply.huggingface.co> 3 年前
add model 3 年前
add model 3 年前
add model 3 年前
add model 3 年前
add model 3 年前
add model 3 年前

language: en

项目介绍

这个开源项目基于LayoutLM架构,专为文档视觉问答和结构化信息提取而优化。它能够理解扫描文档中的文本、布局和视觉元素,适用于发票、表格等复杂文档的智能解析。模型在S2VL数据集上精调,具备出色的多模态推理能力,可广泛应用于自动化办公、金融单据处理等场景,提升文档数字化效率。【此简介由AI生成】

定制我的领域

下载使用量

0

项目总下载次数(含Clone、Pull、 zip 包及 release 下载),每日凌晨更新