来源 :金融界2024-03-27
据国家知识产权局公告,杭州光云科技股份有限公司申请一项名为“基于深度神经网络的训练集快速分析方法及电子设备“,公开号CN117763360A,申请日期为2024年2月。
专利摘要显示,本申请公开了一种基于深度神经网络的训练集快速分析方法及电子设备,包括:采用预训练语言模型对训练集进行训练得到文本特征向量提取器与文本意图分类器;根据文本意图分类器对训练集进行意图预测得到若干对混淆意图对;文本特征向量提取器分别生成若干对混淆意图对的256维特征向量并降维为2维特征向量;将2维特征向量制作散点分布图并均匀等分划分为若干簇;抽取若干簇内一定比例样本进行清洗实现训练集快速分析,本方法将意图间存在数据混淆的情况的数据收集整理,并且只通过具有代表性的一定比例样本的清洗就可以完成整个训练集的清洗,可以节省人力物力,提高工作效率,并且清洗后的训练集的准确性高。