本发明涉及一种视角无关的视频三维人体姿态识别方法,该识别方法包括:步骤1:虚拟数据生成阶段:基于任意包含三维标注的人体姿态数据集,合成虚拟相机参数后生成二维/三维数据元组;步骤2:模型训练阶段:利用生成的二维/三维数据元组分别训练用于获得具有相机视角泛化能力的模型的模块化神经网络第一模块和用于获得能够保护帧间动作连续性的模型的模块化神经网络第二模块;步骤3:无约束视频推理阶段:对于任意无约束采集得到的视频,通过利用步骤2训练得到的多模块深度神经网络预测得到三维人体姿态识别结果。与现有技术相比,本发明基于模块化神经网络组合训练方法,有效提高三维人体姿态识别的泛化能力。
上海交通大学
邱丰 | 马利庄
