来源 :金融界2024-01-10
2024年1月10日消息,据国家知识产权局公告,深圳市中科蓝讯科技股份有限公司申请一项名为“语音处理方法、装置、设备及存储介质“,公开号CN117373474A,申请日期为2023年9月。
专利摘要显示,本申请提供语音处理方法、装置、设备及存储介质,方法包括:计算待处理的目标语音信号的语音幅度谱、谱熵和短时频谱方差,得到目标语音信号对应的多个信号特征;对目标语音信号对应的多个信号特征进行拼接,得到目标语音信号对应的输入特征;将目标语音信号对应的输入特征输入至理想比值掩码预测模型,得到理想比值掩码预测模型输出的目标理想比值掩码,理想比值掩码预测模型为基于互注意力机制的模型;将目标理想比值掩码与目标语音信号的语音幅度谱相乘,得到目标语音信号对应的纯净语音幅度谱;根据纯净语音幅度谱对应的时域信号,确定目标语音信号对应的输出语音信号。该技术方案能够更准确地降噪,达到更好的降噪效果。