基于数据增强和ViT的印章识别方法研究
基于数据增强和ViT的印章识别方法研究

基于数据增强和ViT的印章识别方法研究


标题: 基于数据增强和ViT的印章识别方法研究


作者: 张志剑,夏苏迪,刘政昊,王文慧,陈帅朴


第一作者: 张志剑


机构: 武汉大学信息管理学院,武汉大学大数据研究院,武汉大学信息资源研究中心,南京中医药大学卫生经济管理学院,中国人民大学信息资源管理学院


期刊: 情报学报


发表日期: 2024-03-24


论文摘要: 印章识别因采集标注困难和印章图像退化等导致识别难度较大。数据增强可以缓解数据缺乏的困境,结合ViT (vision transformer)模型提取印章的全局特征,可以提高复杂情境下的印章识别能力。首先根据印章所处的情境特点进行分析,针对分析结果制定数据增强策略,进而扩充训练集;然后将印章图像输入ViT模型中,进行特征提取和印章识别。本文采集并标注《兰亭序》等16幅书法字画上包含的1259枚印章,经过11个数据增强模块处理后,训练集包含127159枚印章图像。与基线模型ResNet50相比,ViT模型的F1值提高了12.17个百分点,去除数据增强所得扩展数据后,所有模型均无法收敛。在标注数据较少的情况下,通过数据增强和ViT模型可以对印章图像进行准确识别。本文方法尚缺少语义推理能力,无法识别训练集中未出现的印章。


知网阅读链接: 点击跳转






提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝