本发明提供了一种基于结构单元的表格识别方法及系统,包括:对文档中表格的结构单元进行识别;基于获取的所述结构单元,对表格进行表格空间结构确定;对文档进行文字检测与识别,并将识别得到的所述文字内容填放到确定的所述表格空间结构中对应的所述结构单元中,对表格进行重建,完成表格识别。本发明同时提供了一种相应的终端及存储介质。本发明提供的基于结构单元的表格识别方法、系统、终端及介质,利用表格中的结构单元有明显的局部空间特征和局部语义特征的特点,直接识别文档中表格的结构单元,无需检测表格线或者表格分隔行列,处理过程简单、准确和高效,同时适用于具有完全表格线和非完全表格线等多种类型的表格情况。
上海交通大学
陈凯 | 徐奕
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日