一种基于深度强化学习的优化芯片布局系统及方法,包括:数据预处理模块、策略网络模块、奖励预测模块和参数更新模块,其中:数据预处理模块读取并解析pl、net文件,将其中的网表图信息转换为智能体的初始状态以及奖励函数;策略网络模块通过卷积神经网络和图神经网络分别得到分别包含粗细粒度的全局嵌入特征与结点嵌入特征,将两个网络分别得到的特征向量融合,最终预测出当前时刻行为,即元件可能的放置位置的概率分布;奖励预测模块在网表图内的所有元件都放置完毕后,对布局结果进行总体评价,估计得到线长和拥塞程度指标反馈给智能体;参数更新模块根据从经验池中进行采样得到的样本采用近端策略优化算法周期地更新神经网络的参数,实现更好的拟合效果。
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日