本发明提供了一种基于人体骨架和图像融合的动作识别方法及存储介质,包括:时间特征提取步骤:输入3D人体骨架序列并利用骨架网络实现时间特征提取;空间特征提取步骤:利用RGB图像使用双注意力神经网络实现空间特征提取;特征融合步骤:将3D骨架序列所提取的时间特征和RGB图像提取的空间特征进行融合。本发明利用3D骨架序列主要是为了提取时间上的信息,利用图像信息主要是为了提取细节信息以及与人交互的物体信息,最后将二者进行融合,保证了动作识别的稳定性和准确性。