乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

一种语音模型压缩方法、电子设备及存储介质

本发明公开了一种语音模型压缩方法、电子设备及存储介质。本发明专为具有编码器‑解码器架构的大规模序列到序列语音识别模型设计。该方法通过依次剪枝解码器和编码器,避免了繁重的反向传播计算。该方法能在无反向传播或重训练的情况下,将Whisper‑large模型的参数减少约60%,且对模型在各种数据集上的表现几乎没有影响。同时,该方法适用于多语言数据集,剪枝后模型在多语言能力上保持了良好的鲁棒性和泛化性。此创新极大降低了大规模模型部署的门槛,使其在资源受限的环境中更易应用。
上海交通大学
钱彦旻 | 顾天腾

More Posts

Send Us A Message