数字人文环境下融入多特征的词命名实体识别
数字人文环境下融入多特征的词命名实体识别

数字人文环境下融入多特征的词命名实体识别


标题: 数字人文环境下融入多特征的词命名实体识别


作者: 张朦,刘忠宝


第一作者: 张朦


机构: 中北大学软件学院,北京语言大学语言智能研究院


期刊: 计算机系统应用


发表日期: 2022-12-05


论文摘要: 近年来,数字人文受到广泛关注,数字人文环境下的词命名实体识别研究日渐兴起,但鲜有研究从字特征的特征表示能力、分词的准确性、领域知识的有效性等方面进行探究.鉴于此,针对汉字的象形文字特点和词文本的特殊性,在字特征的基础上,引入部首特征、格律特征和声韵特征,提出特征增强单元和特征抽取单元,并将词牌知识三元组通过ANALOGY得到的知识向量表示为词牌知识向量,通过双向长短时记忆网络、注意力机制等模型将部首向量、字向量、格律向量、声韵向量、词牌知识向量进行深度融合,最终构建出融入多特征的词命名实体识别方法.在《花间集全译》自制语料上的对比实验和消融实验的结果表明,本文所提方法能够有效利用多特征提升词命名实体识别性能.其F1值达到了85.63%,完成了词命名实体识别任务.


DOI阅读链接: 10.15888/j.cnki.csa.008986






提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝