本发明涉及一种基于平行学习的自动驾驶智能决策控制方法及域控制系统,该方法包括:将自动驾驶决策控制问题划分成子问题,确定出专家模型;基于深度强化学习算法,建立自动驾驶决策控制的状态和动作空间、决策控制规则、奖励函数;以多个专家模型为底层、以多个工人模型为中层、以一个领导模型为顶层,建立平行学习框架和平行仿真环境,对三个模型进行相应训练;在动态变化驾驶环境中测试领导模型的性能,若满足测试要求,则由领导模型观测状态,结合工人模型输出的动作,得到当前决策信息,并执行该决策信息完成车辆控制。与现有技术相比,本发明能有效解决样本数据抽样效率低下、泛化能力差的问题,能够适应动态的驾驶环境和变化的乘车需求。同济大学赵聪 | 陈菁 | 暨育雄 | 杜豫川
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日