本发明涉及一种基站密集型边缘计算网络中的在线任务卸载方法,基于深度强化学习,通过在线学习方式为智能设备用户在一个基站密集网络覆盖区域下移动时,针对不断产生异构的计算任务制定卸载策略,从而使得计算任务的总时延和设备总消耗最小化。本发明算法包含两个交替的阶段,第一个阶段为卸载决策动作的产生,即用户利用深度神经网络选择出最佳卸载决策、CPU频率以及传输功率,再存储下用户和网络的交互过程作为经验。第二阶段为网络训练部分,利用经验回放技术和一个与在线网络结构相同但参数不同的目标网络来训练在线网络的参数。本发明保证在用户无法获取全局和未来信息和设备能耗受限情况下,计算任务的总完成时延和设备能耗开销最小。
上海大学
刘通 | 张亚萌 | 李成范 | 童维勤
