计算机软件及计算机应用文化

基于机器阅读理解的非遗文本实体抽取研究

标题: 基于机器阅读理解的非遗文本实体抽取研究

作者: 范涛,王昊,张卫,李晓敏

第一作者: 范涛

机构: 南京大学信息管理学院,江苏省数据工程与知识服务重点实验室

期刊: 数据分析与知识发现

发表日期: 2022-06-24

论文摘要: 【目的】针对当前非遗文本实体抽取研究的不足，提出以机器阅读理解方法为基础，通过问答的方式对非遗文本中的实体进行抽取。【方法】构建非遗实体敏感的注意力机制，用于捕捉非遗文本上下文同问题之间的联系，使模型关注同问题相关的非遗实体，并建立非遗文本实体抽取模型ICHQA。【结果】将ICHQA模型在标注的非遗语料库中进行实证研究，并同相关基线模型进行对比，结果表明ICHQA在F1指标中表现最优，达87.139%。为凸显模型的优势和增强可解释性，本文还展开了消融实验并对模型输出进行了可视化。【局限】本文提出的模型仅在非遗语料库中进行验证，泛化性测试不够。【结论】利用机器阅读理解进行非遗实体抽取，能够有效利用实体标签的语义特征，提升实体抽取的效果。

关键词:

命名实体识别; 数字人文; 机器阅读理解; 注意力机制; 非物质文化遗产

知网阅读链接: 点击跳转

提示：本站使用最低限度cookies来确保基础功能实现。 View more

同意

拒绝