科大讯飞申请语音识别模型专利，提供一个高效、准确的多语种语音识别模型

http://www.chaguwang.cn 2024-03-16 科大讯飞内幕信息

来源 :金融界2024-03-16

　　2024年3月16日消息，据国家知识产权局公告，科大讯飞股份有限公司申请一项名为“语音识别模型的训练、语音识别方法、装置、设备及介质“，公开号CN117711386A，申请日期为2023年12月。

　　专利摘要显示，本发明提供一种语音识别模型的训练、语音识别方法、装置、设备及介质，其中方法包括：获取初始编码器；基于不同语种下语音的语种共享表征和/或语种特定表征，对初始编码器进行预训练，得到预训练编码器；基于预训练编码器，构建预训练识别模型；对预训练识别模型进行有监督微调，得到语音识别模型。基于不同语种下语音的语种共享表征和/或语种特定表征，对初始编码器进行预训练，得到预训练编码器，可以抑制语种间串扰问题，指导初始编码器学习更易于适应不同语种的语音表征，在不显著增加模型参数量和计算量的情况下，既能提升低资源语种识别性能，又能保持高资源语种性能相较于单语模型不降，从而提供一个高效、准确的多语种语音识别模型。