计算机软件及计算机应用 自动化技术 哲学 针对古代经典文献的引用查找问题的数据构建与匹配方法 标题: 针对古代经典文献的引用查找问题的数据构建与匹配方法作者: 李炜,邵艳秋,毕梦曦,崔晓雅第一作者: 李炜机构: 北京语言大学信息科学学院,东南大学人文学院期刊: 中文信息学报发表日期: 2024-11-15论文摘要: 对早期经典的诠释中的引用进行手工标记需要耗费大量时间与人力成本,因此找到一种自动化的引用查找方法非常重要。以预训练语言模型为代表的自然语言处理技术的发展提升了对于文本处理和理解的能力。据此,该文提出多种利用专家知识或深度学习语义理解能力的无监督基线方法来自动查找古代思想家著作中对早期经典的引用。为了验证该文提出的方法的效果并推动自然语言处理技术在数字人文领域的应用,该文以宋代的理学家二程(程颢、程颐)对早期儒家经典的引用为例进行研究,并构建和发布相应的引用查找数据集(1)。实验表明,该文提出方法基于短句的引用探测ROC-AUC值达到了87.83%。基于段落的引用探测ROC-AUC值达到了91.02%。关键词: 古代文献; 引用查找; 数字人文知网阅读链接: 点击跳转