计算机软件及计算机应用 史学理论 历史文本的词汇标记及应用 标题: 历史文本的词汇标记及应用作者: 项洁,胡其瑞第一作者: 项洁机构: 台湾大学资讯工程学系,台湾大学数位人文研究中心期刊: 数字人文研究发表日期: 2021-02-08论文摘要: 历史文本是历史学研究的基础素材,通过对文本内容的爬网,历史学家将文本中有意义的信息整理、拼凑并脉络化。历史学是一门研究人在时间中的活动轨迹的学科,在加入地理空间的概念之后,历史文本将变得更加立体。跳脱以往在纸本数据中的线性阅读,对信息时代的历史文本,通过技术的协助增添词汇标记,再利用对标记词汇的分析与可视化,鸟瞰并掌握历史文本中隐含的脉络。通过探讨历史文本中人物、时间、地名与对象词汇标记对历史研究的意义,描述各种标记的目的与特性,尤其指出词汇标记不只是辨识词汇,还需要达到"消歧"与"聚合"的功能。同时介绍两个自动标记工具——"码库思古籍半自动标记平台"(MARKUS)和"批次标记工具"(CT Tool)。这两个工具使得大量快速标记人、时、地、物成为可能。透过实际的研究成果案例,说明如何运用标记过的文本;透过时间、人物、地理与对象词汇标记的实际效益,说明历史文本中的词汇标记及其在历史研究中的应用。最后讨论事件标记的问题,指出事件标记与其他词汇标记本质上的不同。关键词: DocuSky; MARKUS; 历史文本; 数字人文; 词汇标记知网阅读链接: 点击跳转