图书情报与数字图书馆 面向先秦典籍的历史事件基本实体构件自动识别研究 标题: 面向先秦典籍的历史事件基本实体构件自动识别研究作者: 王东波,高瑞卿,沈思,李斌第一作者: 王东波机构: 南京农业大学信息科学技术学院,南京理工大学经济管理学院,南京师范大学文学院期刊: 国家图书馆学刊发表日期: 2018-02-15论文摘要: 结合数字人文的数据获取、标注和分析方法,识别和挖掘先秦典籍中历史事件基本实体构件具有重要的推广和使用价值。本文将先秦时期极具代表性的《公羊传》《谷梁传》《左氏春秋》《吕氏春秋》《晏子春秋》等作为处理语料,对其中的人名、地名、时间实体等进行内部数量统计和外部特征分析,构建特征模板。在已有的465,197个词汇的基础上进行实体抽取训练与测试,选出人名、地名、时间实体识别效果的调和平均数最大(87.37%)的模型,并将其应用于《国语》语料以便检验识别效果,同时将以上过程进行可视化展现。关键词: 先秦语料库; 命名实体; 数字人文; 条件随机场DOI阅读链接: 10.13666/j.cnki.jnlc.2018.01.009