乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

一种基于生成对抗模仿学习的空战决策方法及系统

本发明公开了一种基于生成对抗模仿学习的空战决策方法及系统,属于航空技术领域,方法包括:获取战场态势信息,通过预训练的空战决策模型对战场态势信息进行处理,获得用于指导本机的决策结果。空战决策模型通过以下步骤获得:获取典型作战对手数据,对典型作战对手数据进行增强处理,获得红蓝对抗数据集;利用生成对抗模仿学习算法,基于红蓝对抗数据集训练获得空战决策模型。本发明通过算法设计,解决了生成对抗模仿学习训练过程的模态崩塌问题,可保证生成的策略具有多样性、泛化性;通过数据增强方法解决了样本利用效率低下的问题,可基于较少的样本训练得到较好的训练结果;并且在复杂动态环境中仍具有决策的鲁棒性。
复旦大学
姜超然 | 任惠民 | 王衡 | 刘骐嘉 | 李婧惠 | 郝帅

More Posts

Send Us A Message