乐清市盐盆街道纬五路222号乐清加速器B幢203

+86 15669738183

语音识别方法、装置及电子设备

本申请提出了一种语音识别方法、装置及电子设备,获得待识别音频数据及其参考文本数据后,基于编码器获得待识别音频数据的音频特征,基于解码器获得参考文本数据的参考文本特征,并基于语言模型获得参考文本数据的预测词汇特征,由于该预测词汇特征与音频特征和参考文本特征的特征维度相同,能够基于音频特征和参考文本特征,获得针对待识别音频数据的空白字符特征,并基于音频特征和预测词汇特征,获得针对待识别音频数据的实词特征,从而基于空白字符特征和实词特征,精准获得与待识别音频数据对应的转录文本数据。
联想(北京)有限公司 | 上海交通大学
陈谐 | 刘浚哲 | 王一桐

More Posts

Send Us A Message