本发明涉及一种基于边缘计算的任务调度方法,该方法包括以下步骤:各区域维护有一策略网络,基于该策略网络和实时环境,各区域独立对本区域内实时接收到的任务进行调度;所述策略网络的网络参数采用基于联邦学习的深度强化学习算法进行在线更新,具体地:各区域保存历史数据形成本地数据集,基于本地数据集进行深度强化学习训练,更新网络参数,训练目标为最小化所有任务的奖励值;各区域将自身网络参数发送至中央基站,中央基站进行基于联邦学习的统一更新后,将更新后的网络参数反馈给各区域。与现有技术相比,本发明具有增强模型扩展性、保护数据隐私性、提高系统性能等优点。
上海交通大学
秦秀文 | 李颉
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日