乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

一种基于强化学习的干扰资源分配快速决策方法

本发明涉及一种基于强化学习的干扰资源分配快速决策方法,包括以下步骤:引入干扰持续时间,以整个通信周期下干扰方所消耗的总能量最小为目标,构建系统模型;采用基于强化学习的快速决策干扰算法对所述系统模型进行求解,得到干扰决策和资源分配方案,其中,所述快速决策干扰算法采用全并行结构DQN网络,所述全并行结构DQN网络包括信道子网络和功率‑模式‑时间联合子网络;所述信道子网络用于选择干扰信道,所述功率‑模式‑时间联合子网络用于选择干扰功率、干扰样式以及干扰持续时间;所述信道子网络和功率‑模式‑时间联合子网络能够平行学习。本发明能够更有效的进行干扰和资源分配。
中国科学院上海微系统与信息技术研究所
陆永安 | 唐洪莹

More Posts

Send Us A Message