乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

国家技术转移东部中心

乐清市人民政府

智能电气

语言模型训练方法、装置、设备及存储介质

本申请实施例提供了一种语言模型训练方法、装置、设备及存储介质，涉及机器学习技术领域。所述方法包括：基于全量预训练语料对初始的学生语言模型进行全量预训练，得到全量预训练后的学生语言模型；基于增量预训练语料对全量预训练后的学生语言模型进行增量预训练，得到增量预训练后的学生语言模型；其中，增量预训练语料是在全量预训练语料的基础上新增的预训练语料；采用教师语言模型对增量预训练后的学生语言模型进行知识蒸馏处理，得到蒸馏后的学生语言模型；采用目标任务的第二训练样本集，对蒸馏后的学生语言模型进行参数调整处理，得到完成训练的学生语言模型。采用本申请实施例提供的技术方案，能够节省语言模型训练的时间。
腾讯科技(深圳)有限公司 | 上海交通大学
撖朝润 | 张海松 | 徐坤 | 史树明 | 傅洛伊

More Posts

新闻资讯|OUR创新生态联盟体项目路演活动圆满举办 ——聚焦智能电气与新能源技术转化

2025年11月29日

“规则的天空”：中国低空空域管理与安全体系演进趋势研究

2025年11月10日

新闻资讯 | 乐清市科学技术局-国家技术转移东部中心海外项目路演线上专场-中白科技创新对接会

2025年9月24日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办

2023年11月24日

Send Us A Message