史学理论 18世纪德语历史文献的数据挖掘:以主题模型为例 标题: 18世纪德语历史文献的数据挖掘:以主题模型为例作者: 王涛第一作者: 王涛机构: 南京大学历史学院期刊: 学海发表日期: 2017-01-20论文摘要: 主题模型是新近开发出来的研究方法,对于拓展数字人文的研究路径非常有价值。LDA是主题模型算法之一,将它运用到"德语文献档案"收录的1700-1800年间的文献,在归纳、分析文本的主题后,对主题模型方法的有效性进行评判。主题模型的演算结果让我们对18世纪德意志精神世界有了更加立体的认知:18世纪的作者具有强烈的历史意识,对知识体系的构建异常积极,小说受追捧与公共领域的兴起密切相关,宗教启蒙是时代主题。这些结果表明,启蒙运动具备多重面相。在历史研究中需要将以主题模型为代表的远距离阅读与细读有机结合起来,才能够得到更具说服力的研究成果。主题模型作为一种文本挖掘的方法,仍然存在改进的空间,而这种进步需要人文学者与计算专家的通力合作。这也是数字人文继续发展的必由之路。关键词: 主题模型; 启蒙运动; 德意志; 数字史学; 远距离阅读DOI阅读链接: 10.16091/j.cnki.cn32-1308/c.2017.01.021