乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

具有隐私保护的表格类信息抽取系统及方法

一种具有隐私保护的表格类信息抽取系统及方法,包括:位于本地端的结点单元特征收集模块和用户隐私敏感脱敏模块以及位于云端的神经网络采集模块和图神经网络模块,结点单元特征收集模块根据用户输入待识别的图片,通过部署在本地端的文字识别模型和文字定位模型识别出结点得到结点的文字段以及坐标特征,保护用户隐私安全模块利用自注意力机制,通过坐标空间转换文字空间转换将每个结点的文字、坐标信息进行变换并得到原语义在不同维度下的向量,神经网络采集模块将待识别图像通过卷积神经网络的卷积操作提取出图像特征,图神经网络模块根据结点连接关系结点特征,使用图卷积神经网络理解学习结点的位置特征以及邻接关系,最终得到结点连接关系,通过结点单元特征收集模块得到的结点文字、坐标信息以及云服务端返回的结点间的连接依赖关系,提取出整个图片信息并恢复出整个表格。

More Posts

Send Us A Message