本发明提供了一种基于约束残差强化学习的自主赛车控制方法,包括:使用先验控制策略和强化学习控制策略,使得先验控制策略提供指导动作以降低强化学习控制策略的无效探索,加快强化学习控制策略的收敛;通过训练强化学习控制策略提升最终控制策略的性能;限制强化学习控制策略网络的动作输出,确保赛车在训练过程中优先探索与先验控制策略更加相关的区域,以找到最优的驾驶策略。
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日