一种基于Shamir安全多方计算的隐私保护多方强化学习系统及方法,包括:基于shamir的安全定点数计算模块、基于定点数计算实现的安全梯度下降模块、基于安全梯度下降实现的服务器mix网络模块、智能体网络模块和智能体‑服务器通信模块,本发明使用Shamir的秘密分享方案形成服务器间的安全随机梯度下降算法的协议,获得了更灵活的部署能力,并且能够容忍一些掉线。本发明根据安全协议的要求修改Q‑mix模型的网络,确保其对半诚实对手的安全性。
上海交通大学
黄维灿 | 丁宁 | 宦飞
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日