本发明提供了一种基于强化学习的自动驾驶车辆换道轨迹规划方法及系统,涉及自动驾驶技术领域,该方法包括:模型构建步骤:依次构建状态空间、动作空间、状态转移、奖励函数以及安全修正模型;模型训练步骤:构建完成相应模型后,采集训练数据,训练强化学习模型,再对各模型进行相应测试,以实现在不同场景下的换道轨迹规划。本发明能够有效地提高换道过程中的安全性和效率,进而有利于整体交通流的通行效率。 上海交通大学 倪安宁 | 俞岑歆 | 陈钦钦 | 张小宁