计算机软件及计算机应用 自动化技术 中国文学 基于数字人文视域下机器学习的古诗文关键词抽取 标题: 基于数字人文视域下机器学习的古诗文关键词抽取作者: 王琛第一作者: 王琛机构: 齐鲁工业大学(山东省科学院),山东省科学院情报研究所期刊: 数字技术与应用发表日期: 2024-10-01论文摘要: <正>数字人文将计算机技术有机融合于人文学科研究之中,旨在深入、全面地探索、理解和挖掘人文内涵。基于数字人文视域,利用TextRank、TF-IDF(词频-逆文档频率)和LDA算法对辛弃疾的诗词进行关键词抽取探究。通过Pooling的评价方法发现,TextRank算法抽取的关键词结果更好,准确率能达到76.67%,而传统的TF-IDF和LDA算法准确率分别为63.33%和53.33%。同时,根据抽取的关键词,还可以发现辛弃疾诗词的内容主要围绕青山、英雄、江山等关键词进行描述。知网阅读链接: 点击跳转