基于机器阅读理解的非遗文本实体抽取研究
基于机器阅读理解的非遗文本实体抽取研究

基于机器阅读理解的非遗文本实体抽取研究


标题: 基于机器阅读理解的非遗文本实体抽取研究


作者: 范涛,王昊,张卫,李晓敏


第一作者: 范涛


机构: 南京大学信息管理学院,江苏省数据工程与知识服务重点实验室


期刊: 数据分析与知识发现


发表日期: 2022-06-24


论文摘要: 【目的】针对当前非遗文本实体抽取研究的不足,提出以机器阅读理解方法为基础,通过问答的方式对非遗文本中的实体进行抽取。【方法】构建非遗实体敏感的注意力机制,用于捕捉非遗文本上下文同问题之间的联系,使模型关注同问题相关的非遗实体,并建立非遗文本实体抽取模型ICHQA。【结果】将ICHQA模型在标注的非遗语料库中进行实证研究,并同相关基线模型进行对比,结果表明ICHQA在F1指标中表现最优,达87.139%。为凸显模型的优势和增强可解释性,本文还展开了消融实验并对模型输出进行了可视化。【局限】本文提出的模型仅在非遗语料库中进行验证,泛化性测试不够。【结论】利用机器阅读理解进行非遗实体抽取,能够有效利用实体标签的语义特征,提升实体抽取的效果。


知网阅读链接: 点击跳转






提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝