本发明公开一种面向科学数据分析的自动聚类算法选择系统及方法,自动聚类算法选择系统包括数据预处理模块和聚类算法选择器构建模块;所述数据预处理模块包括元数据提取模块和第一单尺度选择模块;所述聚类算法选择器构建模块包括元数据集构建模块、第二单尺度选择模块、多尺度融合模块,多尺度融合模块利用单尺度特征构造Stacking集,基于Stacking集训练随机森林多输出回归模型,得到聚类算法选择器;给定数据集通过数据预处理模块进行预处理后,输入到聚类算法选择器,为给定数据集选择最优聚类算法;本发明能够更加全面地为给定数据集选择最合适的聚类算法,并有效减少计算资源和时间成本。
