计算机软件及计算机应用 图书情报与数字图书馆 面向古籍数字人文的《资治通鉴》自动摘要研究——以SikuBERT预训练模型为例 标题: 面向古籍数字人文的《资治通鉴》自动摘要研究——以SikuBERT预训练模型为例作者: 徐润华,王东波,刘欢,梁媛,陈康第一作者: 徐润华机构: 金陵科技学院,南京农业大学信息管理学院期刊: 图书馆论坛发表日期: 2021-11-11论文摘要: 能降低信息获取成本,对篇幅长而句子短、文字理解门槛高的古籍文献而言尤其必要,但针对古文的自动摘要研究很少。文章面向《资治通鉴》语料,基于SikuBERT预训练模型进行自动摘要实验,并对比其与传统抽取式自动摘要算法和百度智能云摘要分析算法在《资治通鉴》语料上的表现。实验结果表明:基于SikuBERT预训练模型生成的摘要结果在稳定性、覆盖度等方面较好;通过专家人工打分方式,基于SikuBERT预训练模型生成的摘要结果平均得分最高。实验验证了使用数字人文技术对古文进行自动摘要任务的可行性和利用SikuBERT预训练模型对古文进行信息处理的适用性。关键词: SikuBERT; 数字人文; 自动摘要; 预训练模型知网阅读链接: 点击跳转