计算机软件及计算机应用 数字人文环境下融入多特征的词命名实体识别 标题: 数字人文环境下融入多特征的词命名实体识别作者: 张朦,刘忠宝第一作者: 张朦机构: 中北大学软件学院,北京语言大学语言智能研究院期刊: 计算机系统应用发表日期: 2022-12-05论文摘要: 近年来,数字人文受到广泛关注,数字人文环境下的词命名实体识别研究日渐兴起,但鲜有研究从字特征的特征表示能力、分词的准确性、领域知识的有效性等方面进行探究.鉴于此,针对汉字的象形文字特点和词文本的特殊性,在字特征的基础上,引入部首特征、格律特征和声韵特征,提出特征增强单元和特征抽取单元,并将词牌知识三元组通过ANALOGY得到的知识向量表示为词牌知识向量,通过双向长短时记忆网络、注意力机制等模型将部首向量、字向量、格律向量、声韵向量、词牌知识向量进行深度融合,最终构建出融入多特征的词命名实体识别方法.在《花间集全译》自制语料上的对比实验和消融实验的结果表明,本文所提方法能够有效利用多特征提升词命名实体识别性能.其F1值达到了85.63%,完成了词命名实体识别任务.关键词: 命名实体识别; 多特征; 数字人文; 格律; 诗词DOI阅读链接: 10.15888/j.cnki.csa.008986