乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

针对隐私保护神经网络模型的后门攻击的检测与识别方法

本发明提供了一种针对隐私保护神经网络模型的后门攻击的检测与识别方法,所述方法包含以下步骤:步骤(1),产生掩码矩阵和触发器矩阵;步骤(2),设置后门检测相关参数初始状态;步骤(3),构建对抗性输入;步骤(4),进行掩码矩阵和触发器矩阵的优化训练;步骤(5),计算掩码矩阵和触发器矩阵的梯度;步骤(6),重置掩码矩阵和触发器矩阵;步骤(7),触发器逆向工程。本发明使用定点数运算方式在三方环境下进行神经网络模型的训练,得到了保护数据隐私和模型隐私的具有后门的神经网络模型。本发明在四方服务器的环境下能够保护模型参数和数据的隐私并且能够检测模型中是否存在后门以及识别具体被攻击的标签。

More Posts

Send Us A Message