基于数字人文视域下机器学习的古诗文关键词抽取

基于数字人文视域下机器学习的古诗文关键词抽取


标题: 基于数字人文视域下机器学习的古诗文关键词抽取


作者: 王琛


第一作者: 王琛


机构: 齐鲁工业大学(山东省科学院),山东省科学院情报研究所


期刊: 数字技术与应用


发表日期: 2024-10-01


论文摘要: <正>数字人文将计算机技术有机融合于人文学科研究之中,旨在深入、全面地探索、理解和挖掘人文内涵。基于数字人文视域,利用TextRank、TF-IDF(词频-逆文档频率)和LDA算法对辛弃疾的诗词进行关键词抽取探究。通过Pooling的评价方法发现,TextRank算法抽取的关键词结果更好,准确率能达到76.67%,而传统的TF-IDF和LDA算法准确率分别为63.33%和53.33%。同时,根据抽取的关键词,还可以发现辛弃疾诗词的内容主要围绕青山、英雄、江山等关键词进行描述。


知网阅读链接: 点击跳转






提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝