乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

国家技术转移东部中心

乐清市人民政府

首页
关于我们
产业服务
新闻中心
信息中心
联系我们

Menu

首页
关于我们
产业服务
新闻中心
信息中心
联系我们

Home
国家技术转移东部中心乐清分中心

人工智能

一种基于置信区间的深度强化学习动作决策方法

11月 24, 2023
乐清分中心
人工智能

本发明属于人工智能技术领域，公开了一种基于置信区间的深度强化学习动作决策方法，该方法首先提出一种基于深度神经网络的置信区间跨度拟合模型，从根本上解决UCB无法估计高维状态空间下各个动作的置信区间大小的问题；然后提出一种基于目标值原地构建的置信区间跨度平衡模型，利用神经网络反向传播的特性在每次动作决策后更新U网络的参数，从而平衡置信区间跨度；最后引入探索‑利用动态平衡因子α用于平衡训练过程中的探索与利用。该方法应用于解决复杂强化问题，取得了较好的训练效果。

More Posts

新闻资讯|OUR创新生态联盟体项目路演活动圆满举办 ——聚焦智能电气与新能源技术转化

2025年11月29日

“规则的天空”：中国低空空域管理与安全体系演进趋势研究

2025年11月10日

新闻资讯 | 乐清市科学技术局-国家技术转移东部中心海外项目路演线上专场-中白科技创新对接会

2025年9月24日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办

2023年11月24日

Send Us A Message

Full Name

Phone

Email

PrevPrevious一种基于浮标观测数据的海洋内波检测方法

Next一种联合触觉与力反馈的操作感知手套及其人机交互方法Next

乐清分中心将以乐清市科技局为依托，对接国家技术转移东部中心技术资源与服务平台，加强与科研机构以及高校科研院所之间的沟通交流，打通从企业研发到成果转化的全过程，实现对乐清当地企业的精准对接和专业交易服务，营造乐清科技发展新生态。

高德地图 - DIY我的地图

快捷导航

首页
关于我们
产业服务
新闻中心
信息中心
联系我们

首页
关于我们
产业服务
新闻中心
信息中心
联系我们

Copyright © 2022 国家技术转移东部中心乐清分中心 by 科技派