图书情报与数字图书馆 档案及博物馆 基于条件随机场挖掘文本史料中事件信息的方法与实证研究——以《拉贝日记》数字人文研究为例 标题: 基于条件随机场挖掘文本史料中事件信息的方法与实证研究——以《拉贝日记》数字人文研究为例作者: 赵小萱,陈刚,黄紫荆第一作者: 赵小萱机构: 南京大学地理与海洋科学学院,江苏省地理信息技术重点实验室期刊: 图书馆杂志发表日期: 2023-05-26论文摘要: 文本史料被广泛数字化,如何从文本中提取地理命名实体及相关信息,有效开展地理信息挖掘成为重要研究课题。本文针对历史档案文档的特点,提出一种以地理命名实体为核心,使语义信息与地理位置关联,将文本描述的事件信息转化为各个地理命名实体的属性数据的事件抽取理念,提取出有关时间、地点、人物、事物、事件、现象等与地理命名实体相关的事件要素。研究以《拉贝日记》中收录的《日本士兵在南京安全区的暴行》档案为实证案例,采用条件随机场方法,抽取事件信息,结合历史地图等相关资料,将地理信息最终映射到地图上。本文方法拓展文本资料在数字信息时代的开发利用方式,开辟文本挖掘分析与知识发现的新思路。关键词: 信息提取; 地理命名实体; 数字人文; 条件随机场; 特征模板知网阅读链接: 点击跳转