本发明提供了一种金属零件表面文本检测方法和系统,包括:预处理步骤:识别金属表面字符图像,对金属表面字符图像进行图像增强,得到预处理图像;前景特征聚焦步骤:基于预处理图像,通过深度卷积网络高亮文本区域的图像特征,得到显著图;多尺度矫正步骤:利用显著图的像素信息过滤金字塔网络不同层级的背景文本框,通过修正特征网络对被选中的文本框进行评估和预测,得到修正文本框;后处理步骤:计算修正文本框的实例分数,结合预测分数,应用非极大值抑制算法得到最终文本框位置。本发明解决了金属属性和工业环境导致的背景复杂的文本检测问题,实现了金属零件字符图像自动分割,输出高精度文本定位框,提高了检测精度。
上海交通大学
谷朝臣 | 官同坤 | 王臻
