计算机软件及计算机应用 图书情报与数字图书馆 美术书法雕塑与摄影 融合学习扩展的非遗陶瓷工艺领域术语库构建及应用 标题: 融合学习扩展的非遗陶瓷工艺领域术语库构建及应用作者: 汪琳,王昊,李晓敏,邓三鸿第一作者: 汪琳机构: 南京大学信息管理学院,南京大学江苏省数据工程与知识服务重点实验室办公室期刊: 图书馆论坛发表日期: 2023-07-31论文摘要: 文章通过学习扩展的机器学习和深度学习,提出针对非物质文化遗产项目语料的术语抽取及新词发现方法,形成领域术语库并探讨在数字人文领域的应用。首先使用自然语言处理方法对非遗陶瓷语料进行预处理,结合领域术语词表对语料进行标注;然后针对Random-CRFs模型,研究词表特征(DICT)、词性特征(POS)、部首特征(Radical)、拼音特征(Pinyin)对术语抽取效果的影响,再对比Random-CRFs、Random-BiLSTM、Random-BiLSTM-CRFs、BERT-BiLSTMCRFs等4个模型对术语抽取效果的影响;最后使用训练完成的模型对测试集语料进行新词识别,对抽取出的候选词进行人工判断,构建包含1,173个术语的非物质文化遗产陶瓷工艺领域术语库,将其应用于非遗项目画像、非遗陶瓷工艺知识图谱和非遗陶瓷工艺术语检索。关键词: 数字人文; 新词发现; 非物质文化遗产; 领域术语知网阅读链接: 点击跳转