图书情报与数字图书馆 中国民族与地方史志 地方历史文献的数字化、数据化与文本挖掘:以《中国地方历史文献数据库》为例 标题: 地方历史文献的数字化、数据化与文本挖掘:以《中国地方历史文献数据库》为例作者: 赵思渊第一作者: 赵思渊机构: 上海交通大学人文学院历史系期刊: 清史研究发表日期: 2016-11-15论文摘要: 历史文献数据库可区分为数字化、数据化、文本挖掘三种不同形态,迄今多数中文历史文献数据库实现了数字化功能,部分地实现数据化功能,而能够实现文本挖掘功能的则十分少见。数字化是将文献的物理形态转化为电子形态,数据化是将文献转化为可量化分析的数据,编制元数据是主要方法。文本发掘是在此基础上开发文本分析工具。《中国地方历史文献数据库》以文献学研究为基础,建立特定的元数据结构,提供交叉导航、数据统计等多种功能,这些功能不仅可以帮助研究者找到自己的所需文献,更可能帮助研究者发现新的研究议题。史学研究中,数据库有必要被视作一种新的文献形态,建立针对性的文献学方法论。关键词: 元数据; 地方历史文献; 数字人文; 文本挖掘知网阅读链接: 点击跳转