计算机软件及计算机应用 图书情报与数字图书馆 数字人文视域下先秦典籍植物知识挖掘与组织研究 标题: 数字人文视域下先秦典籍植物知识挖掘与组织研究作者: 吴梦成,林立涛,齐月,黄水清,王东波第一作者: 吴梦成机构: 南京农业大学信息管理学院,南京农业大学领域知识关联研究中心期刊: 图书情报工作发表日期: 2023-06-20论文摘要: [目的/意义]挖掘和组织先秦典籍中的植物知识,构建先秦典籍植物知识图谱,对认识我国古代人民社会和生活状态等具有重要意义。[方法/过程]对先秦典籍中植物词进行详尽标注与计量分析;基于条件随机场(CRF)和多种深度学习模型构建古汉语植物命名实体识别模型,比较分析各模型性能以确定最优模型;设计面向知识图谱的古汉语植物知识组织模式。[结果/结论]基于古汉语预训练语言模型SikuRoBERTa构建的古汉语植物命名实体识别模型性能最优,调和平均值达85.44%,为基于实体的植物知识挖掘提供了有效方法;所构建的先秦典籍植物知识图谱可实现对先秦典籍中植物实体及其关联知识的聚合与可视化呈现。关键词: 先秦典籍; 数字人文; 植物命名实体; 深度学习; 知识图谱DOI阅读链接: 10.13266/j.issn.0252-3116.2023.12.010