本发明公开了加权Stacking的即时软件缺陷预测方法及系统,涉及软件缺陷技术领域,包括对原始缺陷数据集进行概率随机特征选择得到特征子集Fn;利用不同的特征变换策略,对各个特征子集中的原始的特征数据进行缩放,并建立分类器;构建初级分类器,构建次级分类器LR,根据分类器求得新的训练集和测试集;将LR在新的测试集上的预测结果和测试集对应的标签对比计算,得到集成模型的各种评价指标得分。本发明改进传统的Stacking模型,给初级分类器分配了权重,减少数据集分配不均带来的差异性,并且对数据进行变换策略,有效防止特征量级的差异影响模型内部处理。
上海应用技术大学
陈丽琼 | 张庆庆 | 孙怀英 | 虞才珠
