专门领域中文文本的无监督分析 邓 柯/清华大学统计学中心 包弼德/美国哈佛大学东亚语言与文化系 Kate J. Li/美国萨福克大学索耶商学院 Jun S. Liu/美国哈佛大学统计学系[1] 陈大龙(译)/浙江大学国际联合学院 #词语发现 #文本切分 #博客 #中国史 #EM算法
基于TopWORDS方法的古文献专名识别——以《汉书》和《明史》为例 大量数字化古代汉语文本资源的出现对其分析工具产生了巨大需求。作为一种基于统计模型…… #《数字人文》2020年第2期 #词语发现 #清华大学 #无监督学习 #中文分词