乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

一种多模型融合的烟草市场监管异常数据挖掘方法

本发明涉及一种多模型融合的烟草市场监管异常数据挖掘方法。该方法主要有以下几个步骤:(1)对烟草市场监管数据集进行数据预处理,将数据处理成静态特征指标与动态特征指标;(2)分别训练基于深度学习的xDeepFM模型,以及XGBoost、LightGBM等机器学习模型,使得各个单一模型达到最优的训练效果;(3)通过集成学习的Stacking方式,将不同的算法模型集成融合,形成一个在整体性能上优于单个基学习器的集成模型,进而提升模型的预测性能;(4)最后使用LightGBM算法完成零售户异常经营行为的概率预测。该模型不仅有效解决了数据在高纬度的稀疏性问题,还让模型自动的去学习特征之间的交叉特性。充分证明了机器学习算法和深度学习网络结合后,能够表现出更加优越的性能。
上海大学
李天举 | 谢志峰 | 丁友东

More Posts

Send Us A Message