本发明提供一种基于Vision MLP的行人重识别方法,首先面向行人重识别任务,采用数据预处理将待测图像划分为预定维度及大小的的图像块序列。然后通过Vision MLP架构建立了行人重识别aMLP‑reID模型,设计了一个基于Vision MLP架构的线性注意力网络和MAL特征提取网络对全局依赖项建模用于特征提取,从而替代了vision transformer中自注意力层用于提取图像中深层特征,来进行行人重识别。而且由于采用线性注意力网络的结构减少了transformer架构中特征提取中平方量级的时间复杂度,因此本发明的基于VisionMLP的行人重识别方法也是为数不多的不使用卷积神经网络结构用于图像检索的行人重识别架构。
