乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

基于约束残差强化学习的自主赛车控制方法

本发明提供了一种基于约束残差强化学习的自主赛车控制方法,包括:使用先验控制策略和强化学习控制策略,使得先验控制策略提供指导动作以降低强化学习控制策略的无效探索,加快强化学习控制策略的收敛;通过训练强化学习控制策略提升最终控制策略的性能;限制强化学习控制策略网络的动作输出,确保赛车在训练过程中优先探索与先验控制策略更加相关的区域,以找到最优的驾驶策略。

More Posts

Send Us A Message