本发明提供一种用于文本图片字符切分的深度学习网络,应用于图像识别技术领域,包括:特征金字塔网络,为基于通道空间双重注意力融合机制的网络结构,用于提取多尺度特征图;区域建议网络,用于在多尺度的特征图上逐像素生成锚点,每个尺度的特征图上都生成相应锚点框,通过所述锚点框进行卷积区分锚点框是前景还是背景的二分类分数;以及前景锚点框与其真值的偏移量;特征区分网络,用于通过将不同尺度的ROI对应至其相应的特征图上并输出相同尺寸的ROI特征图;构建简单卷积层和全连接层再次回归ROI与真值的偏移量来对ROI进行二次修正。应用本发明实施例,能够将图像文字识别和预测相结合,提高识别的准确率。
