图情领域数字人文文献识别与分类方法研究
图情领域数字人文文献识别与分类方法研究

图情领域数字人文文献识别与分类方法研究


标题: 图情领域数字人文文献识别与分类方法研究


作者: 鲁国轩,杨冠灿,宋欣


第一作者: 鲁国轩


机构: 中国人民大学信息资源管理学院


期刊: 情报科学


发表日期: 2022-03-11


论文摘要: 【目的/意义】数字人文作为人文社科和计算机技术的跨界学科,在高速发展的同时面临概念界定不明确、专题期刊缺乏等问题,增加了文献搜集难度。需要构建适合的识别分类模型,形成数字人文专题文献库,助力数字人文研究。【方法/过程】分析数字人文学科的内涵,归纳数字人文文献特征,在人工识读标注的基础上构建机器学习模型,实现对数字人文文献的自动识别与分类。【结果/结论】提出一种基于机器学习的数字人文文献识别分类模型,对图情领域数字人文文献实现了较好的识别效果。【创新/局限】将机器学习算法应用到数字人文文献分类,较好应对了词汇复杂和数据量较小的问题;进一步研究可使用深度学习等更复杂的模型,并实现不同领域数字人文文献的多分类。


DOI阅读链接: 10.13833/j.issn.1007-7634.2022.09.021






提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝