来源 :金融界2024-02-20
据国家知识产权局公告,重庆长安汽车股份有限公司申请一项名为“一种数据分类模型的训练方法、数据分类方法及装置“,公开号CN117573866A,申请日期为2023年10月。
专利摘要显示,本申请涉及一种数据分类模型的训练方法、数据分类方法及装置,涉及自然语言处理和机器学习领域。该方法包括:获取预设数据集;将该预设数据集中包括的多个预设数据进行聚类处理,确定第一分类结果;将该预设数据集中包括的多个预设数据输入初始数据分类模型,得到该预设数据集的第二分类结果;对该第一分类结果与该第二分类结果进行预设操作,以得到目标分类结果;基于该预设数据集的目标分类结果,对该初始数据分类模型进行训练,以生成目标数据分类模型。由此,可以提高数据分类的准确性以及有效性,避免在面对大量的文本数据以及动态变化的文本数据时,可能无法准确地确定出该文本数据的分类的问题。