本发明涉及一种基于强化学习的干扰资源分配快速决策方法,包括以下步骤:引入干扰持续时间,以整个通信周期下干扰方所消耗的总能量最小为目标,构建系统模型;采用基于强化学习的快速决策干扰算法对所述系统模型进行求解,得到干扰决策和资源分配方案,其中,所述快速决策干扰算法采用全并行结构DQN网络,所述全并行结构DQN网络包括信道子网络和功率‑模式‑时间联合子网络;所述信道子网络用于选择干扰信道,所述功率‑模式‑时间联合子网络用于选择干扰功率、干扰样式以及干扰持续时间;所述信道子网络和功率‑模式‑时间联合子网络能够平行学习。本发明能够更有效的进行干扰和资源分配。
中国科学院上海微系统与信息技术研究所
陆永安 | 唐洪莹
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日