来源 :金融界2024-03-19
2024年3月19日消息,据国家知识产权局公告,用友网络科技股份有限公司申请一项名为“一种基于多任务学习的文档图像校正方法和装置“,公开号CN117727039A,申请日期为2023年12月。
专利摘要显示,本发明公开了一种基于多任务学习的文档图像校正方法和装置,该方法包括:文档图像输入、文档分类、目标检测、关键点定位、四方向分类、畸变校正、角度校正、输出结果;本发明还公开了一种基于多任务学习的文档图像校正模型训练方法和装置,该方法包括:文档图像训练数据采集、输入数据预处理、Backbone特征提取、Neck特征融合、Head输出,还包括损失函数确定。本发明利用多任务学习方法,将目标检测、关键点定位、四方向分类和文档分类结合在一起,共同完成文档图像校正任务,其在解决文档图像因拍摄和扫描过程导致的旋转、倾斜和畸变的问题时,可以实现任务之间的信息和特征共享,提高模型效率,提升校正性能,提升后续任务的准确度,具有准确高效的特点。