乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

国家技术转移东部中心

乐清市人民政府

物联网传感

一种基于忆阻器的在线训练强化学习方法

本发明公开了一种基于忆阻器的在线训练强化学习方法：传感器采集智能体当前状态信息St并转换为数字信号，将其编码并转换为电压信号；第一忆阻器交叉杆阵列接收该信号，并对该信号进行乘累加后将输出电流转换为数字信号存储于数字存储器中；当St全部存储于数字存储器中时，处理器进行归一化处理，之后通过第二忆阻器交叉杆阵列进行缩放和偏移；接着全部数据被激活，经过编码并转换为电压信号后传输至第三忆阻器交叉杆阵列，步骤重复次数与隐藏层数相同；第n忆阻器交叉杆阵列接受电压信号输出电流信号并选出最大电流列所表示的动作At，并对最大电流进行电压转换和存储；根据智能体的动作给予奖惩，并将新状态信息St+1存储到经验池中。
上海交通大学
纪志罡 | 景凌琳 | 杜意德

More Posts

新闻资讯|OUR创新生态联盟体项目路演活动圆满举办 ——聚焦智能电气与新能源技术转化

2025年11月29日

“规则的天空”：中国低空空域管理与安全体系演进趋势研究

2025年11月10日

新闻资讯 | 乐清市科学技术局-国家技术转移东部中心海外项目路演线上专场-中白科技创新对接会

2025年9月24日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办

2023年11月24日

Send Us A Message