本申请提出了一种语音识别方法、装置及电子设备,获得待识别音频数据及其参考文本数据后,基于编码器获得待识别音频数据的音频特征,基于解码器获得参考文本数据的参考文本特征,并基于语言模型获得参考文本数据的预测词汇特征,由于该预测词汇特征与音频特征和参考文本特征的特征维度相同,能够基于音频特征和参考文本特征,获得针对待识别音频数据的空白字符特征,并基于音频特征和预测词汇特征,获得针对待识别音频数据的实词特征,从而基于空白字符特征和实词特征,精准获得与待识别音频数据对应的转录文本数据。
联想(北京)有限公司 | 上海交通大学
陈谐 | 刘浚哲 | 王一桐
More Posts
“规则的天空”:中国低空空域管理与安全体系演进趋势研究
2025年11月10日

新闻资讯 | 海外项目路演推介会暨乐清市科学技术局-国家技术转移东部中心产学研项目对接会成功举办
2023年11月24日