本发明涉及一种基于主动学习的材料数据集筛选方法及系统,所述扩充方法包括:抽取未检测的数据池中的不同材料数据对初始训练数据池进行扩充,获得多个扩充得到的训练数据池及多个训练得到的基线模型,作为初步筛选结果;从所述初步筛选结果中,选取性能参数最优的训练得到的基线模型和性能最优的训练得到的基线模型对应的扩充得到的训练数据池作为数据集筛选结果。本发明基于主动学习的思想,利用不同种类的扩充后数据进行模型训练,并根据模型训练结果,确定扩充后数据的优劣,实现了精准的筛选文献数据中的可靠数据,以对实验数据扩充,进而提高训练的性能预测模型的性能。
上海大学
钱权 | 陈水洲
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日