来源 :金融界2023-12-06
金融界2023年12月6日消息,据国家知识产权局公告,中国电信股份有限公司取得一项名为“一种爬虫识别增强的方法及装置、存储介质及电子设备“,授权公告号CN114978674B,申请日期为2022年5月。
专利摘要显示,本申请供了一种爬虫识别增强的方法、装置、存储介质及电子设备。本申请中,由服务器获取待检测网络地址及待检测网络地址对应的用户访问信息;对所述用户访问信息进行泛化处理;根据所述泛化处理后的用户访问信息提取访问源地址、目标矩阵及初始访问特征;将所述初始访问特征与案例特征库中的爬虫特征参数进行比对,进行异常爬取账单识别;将所述访问源地址和所述目标矩阵基于模型策略参数库获取目标结果簇;根据所述目标结果簇,确认所述访问源地址的访问特征是否属于爬虫特征参数;若是,则更新所述模型策略参数库和所述案例特征库,完成自学习。有利于对爬虫特征识别精度的提升,从而达到增加目标网站的反爬虫目的。