计算机软件及计算机应用 图书情报与数字图书馆 面向数字人文的稷下思想自动分类研究 标题: 面向数字人文的稷下思想自动分类研究作者: 冯梦莹,白如江,张玉洁,王效岳,耿振东第一作者: 冯梦莹机构: 山东理工大学信息管理研究院,山东理工大学齐文化研究院期刊: 图书情报工作发表日期: 2022-10-05论文摘要: [目的/意义]稷下思想是先秦百家争鸣时期的沧海遗珠,研究如何从稷下研究文献中自动识别出稷下思想,为稷下学数字人文研究提供方法基础。[方法/过程]选取《管子学刊》作为研究数据源,对其收录的部分文本进行11大类附属42小类的思想类别归纳,构建训练数据集,提出一种基于ERNIE微调的JixiaERNIE模型,将稷下思想自动识别映射为文本自动分类问题,利用模型进行自动分类识别。[结果/结论]通过实验对比得出,构建的JixiaERNIE模型在学习率4e-5、迭代次数为10分类效果达到最优,与基线模型相比,F值提高了7.9%。为进一步增强模型识别分类效果,在模型连接层的基础上加入分类器对比,有效实现面向数字人文研究的稷下思想自动分类任务。关键词: JixiaERNIE; 数字人文; 稷下思想; 管子学刊; 自动分类DOI阅读链接: 10.13266/j.issn.0252-3116.2022.19.003