来源 :金融界2024-03-19
据国家知识产权局公告,中国电信股份有限公司申请一项名为“语音识别方法、装置、非易失性存储介质及电子设备“,公开号CN117727297A,申请日期为2023年12月。
专利摘要显示,本申请公开了一种语音识别方法、装置、非易失性存储介质及电子设备。其中,该方法包括:持续采集待识别音频帧,并将采集的待识别音频帧输入到目标识别模型中,其中,目标识别模型包括多个依次连接的注意力层,目标识别模型用于通过多个注意力层提取待识别音频帧的特征并输出与待识别音频帧对应的识别结果;在目标识别模型识别待识别音频帧的过程中,对目标识别模型中的各个注意力层的历史状态进行更新,得到更新后的目标识别模型;依据更新后的目标识别模型确定待识别音频帧的识别结果。本申请解决了由于相关技术中在识别音频时采用分块处理的方式导致的识别结果输出不流畅的技术问题。