本发明公开了一种基于生成对抗模仿学习的空战决策方法及系统,属于航空技术领域,方法包括:获取战场态势信息,通过预训练的空战决策模型对战场态势信息进行处理,获得用于指导本机的决策结果。空战决策模型通过以下步骤获得:获取典型作战对手数据,对典型作战对手数据进行增强处理,获得红蓝对抗数据集;利用生成对抗模仿学习算法,基于红蓝对抗数据集训练获得空战决策模型。本发明通过算法设计,解决了生成对抗模仿学习训练过程的模态崩塌问题,可保证生成的策略具有多样性、泛化性;通过数据增强方法解决了样本利用效率低下的问题,可基于较少的样本训练得到较好的训练结果;并且在复杂动态环境中仍具有决策的鲁棒性。
复旦大学
姜超然 | 任惠民 | 王衡 | 刘骐嘉 | 李婧惠 | 郝帅
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日