来源 :金融界2024-02-27
金融界2024年2月27日消息,据国家知识产权局公告,北京博睿宏远数据科技股份有限公司申请一项名为“一种文本信息处理方法、装置、电子设备及存储介质“,公开号CN117609498A,申请日期为2023年11月。
专利摘要显示,本发明实施例公开了一种文本信息处理方法、装置、电子设备及存储介质。其中,文本信息处理方法包括:对待处理目标文本信息提取目标短文本信息;对所述目标短文本信息进行单字划分,得到单字划分数据;采用n?gram模型对所述单字划分数据进行拼接,得到单字划分拼接数据;采用MinHash算法对所述单字划分拼接数据和所述待处理目标文本信息匹配的基准目标文本信息计算相似度;根据相似度计算结果,确定所述待处理目标文本信息的分类结果。本发明实施例的技术方案能够降低文本分类处理的计算复杂度,提高文本分类处理的效率和精度。