计算机软件及计算机应用 中国语言文字 文化 数字人文视域下古籍文本命名实体识别研究 标题: 数字人文视域下古籍文本命名实体识别研究作者: 许彬炀第一作者: 许彬炀机构: 南京农业大学信息管理学院期刊: 电脑知识与技术发表日期: 2024-10-05论文摘要: 针对传统古籍文本语义关联性强、情感特征明显,易导致命名实体识别模型产生噪声的问题,本文构建了一种Bert-BiLSTM-MHA-CRF的古籍命名实体识别(NER)模型。首先,通过预训练模型Bert增强对古籍文本信息的表征能力;其次,利用Bi-LSTM模型捕获上下文语义信息;再次,采用MHA加权关键语义特征信息;最后,运用CRF模型进行解码,实现对古籍文本的命名实体识别。实验结果表明,本研究所提出的古籍NER模型在精确率、召回率和F1值上分别为0.877 7、0.880 0和0.878 9,较好地实现了对古籍文本的命名实体识别研究,为“数字人文”研究任务提供了高质量语料数据。关键词: Bert-BiLSTM-MHA-CRF; 古籍文本; 命名实体识别; 数字人文DOI阅读链接: 10.14004/j.cnki.ckt.2024.1504