计算机软件及计算机应用 自动化技术 图书情报与数字图书馆 图情领域数字人文文献识别与分类方法研究 标题: 图情领域数字人文文献识别与分类方法研究作者: 鲁国轩,杨冠灿,宋欣第一作者: 鲁国轩机构: 中国人民大学信息资源管理学院期刊: 情报科学发表日期: 2022-03-11论文摘要: 【目的/意义】数字人文作为人文社科和计算机技术的跨界学科,在高速发展的同时面临概念界定不明确、专题期刊缺乏等问题,增加了文献搜集难度。需要构建适合的识别分类模型,形成数字人文专题文献库,助力数字人文研究。【方法/过程】分析数字人文学科的内涵,归纳数字人文文献特征,在人工识读标注的基础上构建机器学习模型,实现对数字人文文献的自动识别与分类。【结果/结论】提出一种基于机器学习的数字人文文献识别分类模型,对图情领域数字人文文献实现了较好的识别效果。【创新/局限】将机器学习算法应用到数字人文文献分类,较好应对了词汇复杂和数据量较小的问题;进一步研究可使用深度学习等更复杂的模型,并实现不同领域数字人文文献的多分类。关键词: KeyGraph; 主题识别; 学科分类; 数字人文; 机器学习DOI阅读链接: 10.13833/j.issn.1007-7634.2022.09.021