地方历史文献的数字化、数据化与文本挖掘:以《中国地方历史文献数据库》为例
地方历史文献的数字化、数据化与文本挖掘:以《中国地方历史文献数据库》为例

地方历史文献的数字化、数据化与文本挖掘:以《中国地方历史文献数据库》为例


标题: 地方历史文献的数字化、数据化与文本挖掘:以《中国地方历史文献数据库》为例


作者: 赵思渊


第一作者: 赵思渊


机构: 上海交通大学人文学院历史系


期刊: 清史研究


发表日期: 2016-11-15


论文摘要: 历史文献数据库可区分为数字化、数据化、文本挖掘三种不同形态,迄今多数中文历史文献数据库实现了数字化功能,部分地实现数据化功能,而能够实现文本挖掘功能的则十分少见。数字化是将文献的物理形态转化为电子形态,数据化是将文献转化为可量化分析的数据,编制元数据是主要方法。文本发掘是在此基础上开发文本分析工具。《中国地方历史文献数据库》以文献学研究为基础,建立特定的元数据结构,提供交叉导航、数据统计等多种功能,这些功能不仅可以帮助研究者找到自己的所需文献,更可能帮助研究者发现新的研究议题。史学研究中,数据库有必要被视作一种新的文献形态,建立针对性的文献学方法论。


知网阅读链接: 点击跳转






提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝