本发明属于大数据挖掘技术领域,具体为基于用户语义、属性和邻域信息的社交机器人检测算法。本发明算法包括:通过BERT模型对文本内容进行编码,建模用户的语义表示,并联合用户属性和邻域特征,以用户为节点,转发关系为连边构建用户关系网络。将构建好的图数据使用改进的图注意力网络模型进行自监督训练来学习社交用户表示。模型通过子图采样的方式来进行并行化计算,并使用多任务学习设置辅助任务。为了解决数据不平衡问题,采用条件对抗生成网络进行数据增广,对最终得到的用户向量表示进行基于密度的聚类,得到是否是社交机器人的鉴别结果。本发明算法采用自监督技术并引入对抗性思路,可推广性强,迎合未来技术发展趋势。
复旦大学
李聪 | 陈诺 | 李翔
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日