乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

基于深度强化学习的移动能源网络实时能量管理方法及系统

本发明提供了一种基于深度强化学习的移动能源网络实时能量管理方法及系统,包括:步骤S1:基于马尔科夫决策过程表征全电力船舶的实时能量调控过程,包括:状态空间、动作空间以及奖励函数;步骤S2:构建表示动作价值函数的Q网络模型,并利用状态空间、动作空间以及奖励函数采用DQN算法训练Q网络模型;步骤S3:基于当前状态空间通过训练后的Q网络模型选择决策动作,实现船舶的实时能量管理智能决策;所述Q网络模型是通过神经网络的输入输出拟合船舶期望做出最优能量管理智能决策的这一行为过程,实现了从状态空间到动作空间的映射,达到了依据船舶运行的实时状态进行最优能量管理的目的。

More Posts

Send Us A Message