来源 :金融界2024-03-12
据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“数据构建方法、模型训练方法、答案确定方法及相关装置“,公开号CN117688144A,申请日期为2023年10月。
专利摘要显示,本申请公开了一种数据构建方法、模型训练方法、答案确定方法及相关装置,该方法包括:获取样本医学问题;基于样本医学问题,构建关于样本医学问题的正样本知识数据,以及,构建关于样本医学问题的负样本知识数据;其中,正样本知识数据为对回答样本医学问题有帮助的第一医学知识数据,负样本知识数据为对回答样本医学问题无帮助的第二医学知识数据,正样本知识数据和负样本知识数据用于对经预训练的语言大模型进行微调,经微调后的语言大模型能够生成对应于输入的医学问题的答案。通过上述方式,本申请能够构建高质量的用于微调语言大模型的样本数据。