文艺理论 数字人文范式下机器学习文本分类应用于翻译研究的路径探索——以翻译汉语句法特征研究为例 标题: 数字人文范式下机器学习文本分类应用于翻译研究的路径探索——以翻译汉语句法特征研究为例作者: 钟书能,杨立汝第一作者: 钟书能机构: 华南理工大学外国语学院期刊: 上海交通大学学报发表日期: 2024-08-26论文摘要: 文本分类等大数据挖掘技术的应用是数字人文范式下翻译研究的主要特征之一。翻译语言特征研究是翻译研究的基础领域。本研究提出机器学习文本分类应用于翻译语言特征研究的“五步法”研究路径,包含文本分类数据远观、贡献度排序特征中观、随机选择文本细读、语言规律总结和规律成因阐释等五个步骤。本研究依循该路径考察了翻译汉语的句法特征,发现翻译汉语相比原创汉语的最显著特征是数词在“数词+作名词的量词”表名词短语、习语、“数词+量词+名词”表模糊义等范畴边缘成员上的负使用,其认知成因在于译者倾向于忽略语义网络中突显程度较低的范畴边缘成员。案例研究表明,引入机器学习文本分类算法能够提升语言宏观描写层面的全面性、客观性与科学性,基于数据结论随机选择文本开展语例细读则有助于深入挖掘形式数据背后隐含的更细颗粒度的语言规律。本研究旨在为数字人文范式下的翻译研究提供新的方法与思路。关键词: 五步法; 数字人文; 文本分类; 机器学习; 翻译语言特征研究DOI阅读链接: 10.13806/j.cnki.issn1008-7095.2024.08.001