乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

一种基于主动学习的材料数据集筛选方法及系统

本发明涉及一种基于主动学习的材料数据集筛选方法及系统,所述扩充方法包括:抽取未检测的数据池中的不同材料数据对初始训练数据池进行扩充,获得多个扩充得到的训练数据池及多个训练得到的基线模型,作为初步筛选结果;从所述初步筛选结果中,选取性能参数最优的训练得到的基线模型和性能最优的训练得到的基线模型对应的扩充得到的训练数据池作为数据集筛选结果。本发明基于主动学习的思想,利用不同种类的扩充后数据进行模型训练,并根据模型训练结果,确定扩充后数据的优劣,实现了精准的筛选文献数据中的可靠数据,以对实验数据扩充,进而提高训练的性能预测模型的性能。
上海大学
钱权 | 陈水洲

More Posts

Send Us A Message