乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

基于结构单元的表格识别方法、系统、终端及介质

本发明提供了一种基于结构单元的表格识别方法及系统,包括:对文档中表格的结构单元进行识别;基于获取的所述结构单元,对表格进行表格空间结构确定;对文档进行文字检测与识别,并将识别得到的所述文字内容填放到确定的所述表格空间结构中对应的所述结构单元中,对表格进行重建,完成表格识别。本发明同时提供了一种相应的终端及存储介质。本发明提供的基于结构单元的表格识别方法、系统、终端及介质,利用表格中的结构单元有明显的局部空间特征和局部语义特征的特点,直接识别文档中表格的结构单元,无需检测表格线或者表格分隔行列,处理过程简单、准确和高效,同时适用于具有完全表格线和非完全表格线等多种类型的表格情况。
上海交通大学
陈凯 | 徐奕

More Posts

Send Us A Message