本发明提供了一种基于群智网络测量数据的高延迟异常检测方法及系统,包括:对原始数据集进行特征工程,去除异常值与缺失值,并将原始数据统一进行数值化与离散化;将包含相同特征的原始数据聚类为一个实例,计算对应权重并打上标签,作为输入决策树模型的基本单位;将预处理后的原始数据集随机采样生成多个子数据集,并对每个子数据集进行CART决策树建模得到子树;基于每个子树的拓扑信息与节点信息进行高延迟异常规则挖掘;基于树节点的样本子空间的网络延迟状况,对每条规则进行标定及置信度评分;将所有子树的规则挖掘结果进行合并,生成最终的网络高延迟异常检测结果。本发明提高了算法泛化性和鲁棒性,从而有效检测出高延迟网络异常。
上海交通大学
李扬 | 孙嘉辰 | 黄闻光 | 田晓华 | 王新兵
