针对古代经典文献的引用查找问题的数据构建与匹配方法

针对古代经典文献的引用查找问题的数据构建与匹配方法


标题: 针对古代经典文献的引用查找问题的数据构建与匹配方法


作者: 李炜,邵艳秋,毕梦曦,崔晓雅


第一作者: 李炜


机构: 北京语言大学信息科学学院,东南大学人文学院


期刊: 中文信息学报


发表日期: 2024-11-15


论文摘要: 对早期经典的诠释中的引用进行手工标记需要耗费大量时间与人力成本,因此找到一种自动化的引用查找方法非常重要。以预训练语言模型为代表的自然语言处理技术的发展提升了对于文本处理和理解的能力。据此,该文提出多种利用专家知识或深度学习语义理解能力的无监督基线方法来自动查找古代思想家著作中对早期经典的引用。为了验证该文提出的方法的效果并推动自然语言处理技术在数字人文领域的应用,该文以宋代的理学家二程(程颢、程颐)对早期儒家经典的引用为例进行研究,并构建和发布相应的引用查找数据集(1)。实验表明,该文提出方法基于短句的引用探测ROC-AUC值达到了87.83%。基于段落的引用探测ROC-AUC值达到了91.02%。


知网阅读链接: 点击跳转






提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝