乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

基于平行学习的自动驾驶智能决策控制方法及域控制系统

本发明涉及一种基于平行学习的自动驾驶智能决策控制方法及域控制系统,该方法包括:将自动驾驶决策控制问题划分成子问题,确定出专家模型;基于深度强化学习算法,建立自动驾驶决策控制的状态和动作空间、决策控制规则、奖励函数;以多个专家模型为底层、以多个工人模型为中层、以一个领导模型为顶层,建立平行学习框架和平行仿真环境,对三个模型进行相应训练;在动态变化驾驶环境中测试领导模型的性能,若满足测试要求,则由领导模型观测状态,结合工人模型输出的动作,得到当前决策信息,并执行该决策信息完成车辆控制。与现有技术相比,本发明能有效解决样本数据抽样效率低下、泛化能力差的问题,能够适应动态的驾驶环境和变化的乘车需求。同济大学赵聪 | 陈菁 | 暨育雄 | 杜豫川

More Posts

Send Us A Message