本发明公开了一种渐进式目标精细识别与描述方法,以视频目标识别为背景,从视频特征多层次获取和渐进式目标精细识别与描述的理论和方法开展研究工作。首先,对视频目标进行检测与分割,从而识别目标的各个部件;然后,基于部件识别进一步提取视频目标的多粒度特征;最后,融合多粒度特征来实现目标的精细识别,并生成精细化描述文本信息。本发明通过模拟人类认识和描述图像的方法,建立基于部件的多层次深度特征提取方法,为视频目标特征提取提供有效的理论和方法;通过自然语言处理技术构造基于模板匹配的视频目标精细化描述方法,为多层次视频目标识别与描述提供新的思路。本发明将丰富和拓展机器学习理论和方法。
同济大学
卫志华 | 沈雯 | 张彬彬 | 崔昊人 | 李倩文
