来源 :金融界2024-03-16
2024年3月16日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“语音识别模型的训练、语音识别方法、装置、设备及介质“,公开号CN117711386A,申请日期为2023年12月。
专利摘要显示,本发明提供一种语音识别模型的训练、语音识别方法、装置、设备及介质,其中方法包括:获取初始编码器;基于不同语种下语音的语种共享表征和/或语种特定表征,对初始编码器进行预训练,得到预训练编码器;基于预训练编码器,构建预训练识别模型;对预训练识别模型进行有监督微调,得到语音识别模型。基于不同语种下语音的语种共享表征和/或语种特定表征,对初始编码器进行预训练,得到预训练编码器,可以抑制语种间串扰问题,指导初始编码器学习更易于适应不同语种的语音表征,在不显著增加模型参数量和计算量的情况下,既能提升低资源语种识别性能,又能保持高资源语种性能相较于单语模型不降,从而提供一个高效、准确的多语种语音识别模型。