本发明公开了一种基于模糊K近邻的Windows恶意软件识别方法。收集足够量的已知恶意软件和良性软件组成样本库。使用反汇编技术提取样本库中所有样本的PE结构信息。再使用模糊集理论计算样本的模糊区间和隶属度,从而得到样本的模糊特征向量。对于输入的待检测样本,使用相同的方法得到其模糊特征向量。通过最大模糊区间匹配原则找到具有最大模糊区间匹配度的集合,再从该集合中找到K个与待检测样本具有最小欧式距离的样本。并根据距离按从小到大进行排序,使用排序下标的倒数作为投票权重。统计各个类别的投票权重之和,使用最大权重之和的类别作为预测标签。该方法具有简单、高效的优点,在保障准确率的基础上很好地提高了检测效率。
上海大学
钱权 | 唐明东
