来源 :金融界2024-01-03
据国家知识产权局公告,太极计算机股份有限公司申请一项名为“一种用于集群的标签纠正方法”,公开号CN117332303A,申请日期为2023年12月。
专利摘要显示,本发明提供了一种用于集群的标签纠正方法,属于标签纠正技术领域,包括:对每个主集群进行无监督的特征选择得到每个主集群所对应的第一多维度标签;创建元集群,获取每个元集群中的元簇,并对第一多维度标签进行降维处理,得到每个元集群第二多维度标签;获取待分配样本的样本特征信息和每个待分配样本的样本特征信息与每个元簇的相似度,并将每个待分配样本分配至相似度最高的元簇中得到最终簇;获取最终簇特征信息,并对相应的第二多维度标签进行纠正。通过这样的方法,通过无监督特征选择得到第一多维度标签,并通过重新集群进行降维处理得到第二多维度标签再通过相似度对样本进行分配,保证样本能够被分配到具有最高相似性的元簇,从而保证了标签的准确性。