其他 数字人文环境下古今汉语词汇长度探究 标题: 数字人文环境下古今汉语词汇长度探究作者: 秦贺然第一作者: 秦贺然机构: 连云港中医药高等职业技术学校现代技术教育中心图书馆期刊: 散文百家发表日期: 2021-09-15论文摘要: 在数字人文和图书情报领域相融共生的背景下[1],本文基于计算机技术对古今汉语词汇长度进行了探究。首先人工录入《春秋经传引得(上册)》《春秋经传引得(下册)》《三国志》《汉书》《后汉书》《史记》六本先秦时期古文献词头,利用C语言程序对六本文献进行半自动分词。借助Excel统计分析软件,得出古籍文献词汇长度的分布情况,从而分析古人的用词习惯。再基于对现代汉语文本《人民日报》词频、词汇长度分布的统计,分析出古文本与现代汉语文本词汇长度的不同之处,比较古人与现代人在撰写文献时的用词习惯。关键词: 文本挖掘; 数字人文; 自动分词; 词汇长度知网阅读链接: 点击跳转