融合学习扩展的非遗陶瓷工艺领域术语库构建及应用
融合学习扩展的非遗陶瓷工艺领域术语库构建及应用

融合学习扩展的非遗陶瓷工艺领域术语库构建及应用


标题: 融合学习扩展的非遗陶瓷工艺领域术语库构建及应用


作者: 汪琳,王昊,李晓敏,邓三鸿


第一作者: 汪琳


机构: 南京大学信息管理学院,南京大学江苏省数据工程与知识服务重点实验室办公室


期刊: 图书馆论坛


发表日期: 2023-07-31


论文摘要: 文章通过学习扩展的机器学习和深度学习,提出针对非物质文化遗产项目语料的术语抽取及新词发现方法,形成领域术语库并探讨在数字人文领域的应用。首先使用自然语言处理方法对非遗陶瓷语料进行预处理,结合领域术语词表对语料进行标注;然后针对Random-CRFs模型,研究词表特征(DICT)、词性特征(POS)、部首特征(Radical)、拼音特征(Pinyin)对术语抽取效果的影响,再对比Random-CRFs、Random-BiLSTM、Random-BiLSTM-CRFs、BERT-BiLSTMCRFs等4个模型对术语抽取效果的影响;最后使用训练完成的模型对测试集语料进行新词识别,对抽取出的候选词进行人工判断,构建包含1,173个术语的非物质文化遗产陶瓷工艺领域术语库,将其应用于非遗项目画像、非遗陶瓷工艺知识图谱和非遗陶瓷工艺术语检索。


知网阅读链接: 点击跳转






提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝