本发明提供一种用于文档图像识别的关键信息抽取方法及装置,该方法包括:基于OCR识别结果,对每个键确定预设数量的候选键值;根据每个键选取对应的候选键值的评分,确定所有键选取候选键值的候选路径总评分;在所述候选路径总评分最高的情况下,确定每个键选取的目标键值,以得到对应的信息抽取结果;其中,每个键选取对应的候选键值时的评分,至少包括键与候选键值的位置关系确定的评分值。该方法有效避免了类似基于规则的信息抽取方法中固定关键词带来的易出错问题。同时,该方法综合考虑所有候选键值选取情况,有效利用了关键信息之间的相互联系以及互斥性,从而具有较高的准确率,可解决相似实体信息抽取的全局优化问题。
