计算机软件及计算机应用 图书情报与数字图书馆 中国文学 古籍文本结构化、知识体系化、利用智能化的实践探索——以璇琮数字人文智慧平台的设计与建设为例 标题: 古籍文本结构化、知识体系化、利用智能化的实践探索——以璇琮数字人文智慧平台的设计与建设为例作者: 李飞跃,郝若辰,朱厚权第一作者: 李飞跃机构: 清华大学人文学院期刊: 数字人文发表日期: 2022-12-31论文摘要: 清华大学“璇琮数字人文智慧平台”由针对古籍自动整理与知识挖掘的文本工具系统、协助研究与创作的诗歌智能分析系统以及包含传统文史与佛教、经学、天文学等研究数据的文献资源系统组成。文本工具系统下含古籍文本处理、文本挖掘与分析、视觉呈现三组模块,模块下的各子功能可根据应用需求实现流程化串联。诗歌智能分析系统以永明律与平仄律的批量自动分析、相似度与因袭关系发现及集句诗自动创作为特色功能,能够辅助古典诗歌的跨文本分析与知识图谱构建。文献研究资源提供图文对照数字化古籍资源与结构化明清小说语料,不仅广泛适用于平台各层级的功能,也是古典诗歌与小说研究的结构化专精数据库。该平台应用于教学,支持对自定义文本从自动句读、分词、实体识别等预处理阶段到风格计算、情感计量、主题模型、关系提取等任务端处理的一体化实现,并辅以案例进行成果展示,初学者可直接上手操作。未来将在开放、共建、共享的基础上,打造技术与人文实时交互的科研生态系统,创设与新时代教学相适应的应用场景,实现“人人皆可数字人文”的目标。关键词: 数字基础设施; 文本挖掘与可视化; 自动古籍处理; 诗歌智能分析知网阅读链接: 点击跳转