乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

基于超声波感知的交互不受限语音增强方法、系统及终端

本发明提供一种基于超声波感知的交互不受限语音增强方法、系统及终端,通过短时傅里叶变换对由麦克风接收的来自说话人的待增强的噪声音频信号进行处理得到对应的时频谱,并基于构建的基于记忆模块的超声波语音增强网络,根据待增强的噪声音频信号对应的时频谱以及待增强的噪声音频数据所对应的说话人特征向量获得待增强的噪声音频信号对应的增强后的语音信号。本发明通过融合说话人特征向量以及记忆模块到超声波语音增强网络中,使得可以通过仅使用噪声音频输入来生成相应的超声波特征向量,完成使用超声波语音增强的目的。相较于其他超声波语音增强的方法,增强了交互性。相较于纯音频模态语音增强的方法,提高了性能,并可以处理多说话人、低信噪比等复杂噪声环境。
上海交通大学
刘客 | 王东 | 张谦

More Posts

Send Us A Message