数字人文下的先秦古汉语关键词抽取应用——以《春秋经传》为例
数字人文下的先秦古汉语关键词抽取应用——以《春秋经传》为例

数字人文下的先秦古汉语关键词抽取应用——以《春秋经传》为例


标题: 数字人文下的先秦古汉语关键词抽取应用——以《春秋经传》为例


作者: 秦贺然,王东波


第一作者: 秦贺然


机构: 连云港中医药高等职业技术学校现代技术教育中心图书馆,南京农业大学信息科学技术学院


期刊: 图书馆杂志


发表日期: 2020-11-15


论文摘要: 数字人文作为一门交叉学科,其强调计算技术与人文学科融合发展。古汉语典籍是人文学科研究中重要的一部分,在此背景下,利用计算机技术对数字化后的《春秋经传》典籍进行关键词抽取探究,从而分析春秋经传的关键词分布情况。本文利用了三种关键词抽取算法,分别是基于无监督的TextRank算法、经典传统TF-IDF算法和LDA主题模型算法。基于Pooling的评价方法发现TextRank算法抽取的关键词结果更好,准确率达到84%。传统的TF-IDF算法和LDA主题模型算法准确率分别为62%和74%。同时,根据所抽取的关键词,可以发现春秋经传的记事内容主要围绕在诸侯国之间的聘问、会盟、征伐、婚丧、篡弑等。


DOI阅读链接: 10.13663/j.cnki.lj.2020.11.014






提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝