本发明提供了一种融合多种文本特征及几何信息的表格识别方法,包括:数据处理步骤:获取表格区域的图片,分别对获取的图片进行OCR识别与直线识别,获得关键特征信息;图卷积神经网络训练步骤:根据获得的关键特征信息,进行图卷积神经网络训练,构建表格结构识别模型;表格识别步骤:根据构建的表格结构识别模型,对图片格式的表格进行结构识别。本发明提出了一种融合多种文本特征及几何信息的表格识别方法,从采用数据的多样性方面和对数据进行特征提取的方法等方面进行改进,有效提升了表格识别的准确率,获得了更加准确的表格结构重建结果,相对现有基于传统规则的表格识别机制及基于图片的传统深度学习方法有了很大的提升效果。
上海交通大学
李一仁 | 黄征 | 周异 | 陈凯
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日