本发明公开了一种基于深度强化学习的软件定义网络路由方法,包括:基于网络实际运行参数,根据大流优先调度的原则和任务目标分别对网络流信息进行状态设计和动作设计;基于软件定义网络SDN控制器获取的网络带宽数据构建网络拥塞模型;根据网络拥塞模型和网络QoS数据进行奖励设计,并结合状态设计和动作设计训练强化学习模型;强化学习模型基于实际网络流的状态值实现路由的选择。本发明利用强化学习作为整个方法的主体框架,通过对网络中大象流优先调度,在原始带宽数据的基础上,基于大流优先调度进行强化模型的状态设计,提高了网络各项QoS指标,进一步结合网络拥塞模型提高强化学习模型的训练效果。
同济大学
蒋昌俊 | 闫春钢 | 丁志军 | 王俊丽 | 张亚英 | 柯宇
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日