其他

基于数据增强和ViT的印章识别方法研究

标题: 基于数据增强和ViT的印章识别方法研究

作者: 张志剑,夏苏迪,刘政昊,王文慧,陈帅朴

第一作者: 张志剑

机构: 武汉大学信息管理学院,武汉大学大数据研究院,武汉大学信息资源研究中心,南京中医药大学卫生经济管理学院,中国人民大学信息资源管理学院

期刊: 情报学报

发表日期: 2024-03-24

论文摘要: 印章识别因采集标注困难和印章图像退化等导致识别难度较大。数据增强可以缓解数据缺乏的困境，结合ViT (vision transformer)模型提取印章的全局特征，可以提高复杂情境下的印章识别能力。首先根据印章所处的情境特点进行分析，针对分析结果制定数据增强策略，进而扩充训练集；然后将印章图像输入ViT模型中，进行特征提取和印章识别。本文采集并标注《兰亭序》等16幅书法字画上包含的1259枚印章，经过11个数据增强模块处理后，训练集包含127159枚印章图像。与基线模型ResNet50相比，ViT模型的F1值提高了12.17个百分点，去除数据增强所得扩展数据后，所有模型均无法收敛。在标注数据较少的情况下，通过数据增强和ViT模型可以对印章图像进行准确识别。本文方法尚缺少语义推理能力，无法识别训练集中未出现的印章。

关键词:

数字人文; 印章识别; 数据增强; 深度学习

知网阅读链接: 点击跳转

提示：本站使用最低限度cookies来确保基础功能实现。 View more

同意

拒绝