文图学与人工智能生成诗* – 中国数字人文

衣若芬 / 新加坡南洋理工大学人文学院

摘　要：自1950年代以来，科学家开发的“人工智能”（Artificial Intelligence）有飞跃式的进展。人工智能不但能协助或替代人的四肢，进行体力劳动，还类比人脑，生成文学、音乐、绘画等艺术作品。“文图学”重视图像对认知判断和行动的影响，和人工智能生成艺术的原理相近。文章以微软少女小冰为例，用文图学的观点拆解小冰生成诗的过程，并置传为北宋徽宗所绘《蜡梅山禽图》，思考人类艺术无可被人工智能取代的精义。

关键词：文图学　人工智能　微软小冰　《蜡梅山禽图》

前　言

2017年，史上第一部由人工智能“少女小冰”生成的华语现代诗集《阳光失了玻璃窗》在中国出版，[1]这是继前一年Google DeepMind开发的AlphaGo打败世界围棋冠军、韩国棋手李世乭之后，人工智能的又一大突破，显示出人工智能非但能利用超强于人脑和体力的反复刻意练习，发展出人类所设想不到的棋路，还能够经由吸收学习人类的文学创作，生成通过图灵测试（Turing test）[2]的诗篇。

在出版《阳光失了玻璃窗》之前，通过图灵测试的作诗人工智能创作是2016年北京清华大学语音与语言试验中心人工智能“薇薇”的25首旧体诗。[3]之后，在2019年，少女小冰和200位作者合作出版了诗集《花是绿水的沉默》，[4]这也是世界上第一部人机协同创作的文学作品。由小冰提供初稿，再经文学爱好作者二次创作而成。[5]

不断拓展和进化的小冰，除了文学，还迈向绘画和音乐的领域。2019年，小冰化名“夏语冰”，在中央美术学院毕业，并举行个展，隔年出版绘画作品集《或然世界：谁是人工智能画家小冰？》。[6]同样在2020年，小冰毕业于上海音乐学院音乐工程系，获得“荣誉毕业生”佳绩。[7]作词、作曲、唱歌、主持，永远18岁的小冰成为虚拟世界的全方位艺人。同年，小冰发布“X套件应用”，包括X Writer、 X Studio、X Presenter。

关于机器参与绘画和音乐创作，数学家兼绘图师本杰明·弗朗西斯·拉波斯基（Benjamin Francis Laposky，1914—2000）曾于1952年利用示波器（oscillonscope）制作图像，举办《电子抽象》（Electronic Abstractions）展览。1956年，列哈伦·希勒（Lejaren Hiller，1924—1994）用伊利诺大学的电脑ILLIAC I制作了弦乐四重奏《伊利亚克组曲》（Illiac Suite）。随着人工智能的开发成熟，2017年美国歌手Taryn Southern发行的专辑I AM AI中收录了一首由她作词和创作主旋律、人工智能AmperAI编曲的作品Break Free。[8]2018年，一幅以43.2万美元高价在佳士得拍卖成交的埃德蒙·贝拉米（Edmond de Belamy）肖像画，实则是人工智能学习14至19世纪15,000幅肖像画而合成的作品。[9]

人工智能制造的艺术已经逐渐为人所知，值得多方探讨，本文聚焦于文字生成。[10]过去关于人工智能生成诗，主要环绕于以下几个层面：

（1）文学定义：人工智能生成的文字组合是否可以视为具有文学意义的诗？如何评价？[11]

（2）机器威胁：如果肯定人工智能生成的文字组合即是诗，它是否可能取代人类的创作？突破人类创作的困境，造成诗人的危机？[12]

（3）科技伦理：利用科技生成的诗，是否受法律和版权保护？[13]

这些层面均触及了人工智能写作的议题，值得再加探究。本文尝试采用文图学的观点，用意稍有不同。“文学定义”“机器威胁”“科技伦理”着重的是对已经生成的作品的分析，也就是从人工智能产出的结果与人类智能所达到的水平相比，思考如何面对人工智能生成作品高效快速且接近人类智能，人类的存在意义，以及作品的归属问题。

文图学的观点不只谈结果，也关心过程，即算法怎样推演出诗歌？这借鉴了人类“应物斯感”而创作艺文的方式，以往例如《文心雕龙》谈“神思”，文学是情思的凝结。那么，基本上缺乏主体情思的人工智能只凭借演法（algorithm）就可以生成“像诗的文字”，触媒在于图像，和文图学的核心相同，或可将二者并置观察，从“图像文学化”的角度，理解人工智能生成诗的构成，希望从人与机器的利用、竞争关系，偏移至合作关系，从而思考人类艺术的精义。

一、文图学（Text and Image Studies）与人工智能（AI）

文图学的“文”指的是文本（text），“图”指的是图像（image），文图学探究的是通过图像被观看和感知的文本。过去谈文本，较偏向于文字，尤其是文学性的文字书写；谈图像，则偏向于绘画和影视等创制，为了突显文本和图像的个别媒材性质，以及二者可能的交互会通，因而将文本和图像概括为诗与画，或从时间、或从空间，谈二者作为姐妹艺术的独立和组合，例如莱辛（Gotthold Ephraim Lessing，1729—1781）的《拉奥孔》、[14]钱锺书谈《中国诗与中国画》。[15]到了罗兰巴特（Roland Barthes， 1915—1980），指出文本的多重界定，松动了文本必然合乎艺术价值的看法。[16]W. J. T. Mitchell致力于阐述文本和图像的分、合、叠加；[17]John Bateman认为文化生产的原初样貌就是包括文本和图像，二者不必强加区隔。[18]笔者吸收了前贤的观点，突破文本和图像的纠缠，提出几点浅见：

1.文本强调的是被诠释的多元与开放特性，所有眼见和心想的像（image）都是文本，所谓“万物皆文本”，图像也是一种文本类型。

2.文本依呈现的类型，包括肢体、声音和图像，“图像”一词有两重涵义——既指涉所有以像/图的形式的文本，包括形象、意象乃至于梦境、想象等虚拟抽象的介质；也是文本的存在本质，即所有的文本因观想而存在。

3.既然“万物皆文本”，文本因观想而存在，人类的认知来源将近80%经由视觉，大脑三分之一的神经元作用于处理视觉讯息，因此，视觉的输入、分析和判断直接影响我们的观点和行为。人们解读观想的文本，便是展示对世界的认知，故而主张“文图学就是看世界”。

我们可以把文图学的文本概念简化为图1。

图1 文图学的构成

在文图学的概念框架下，笔者从文学与绘画的互动、互文和再生，拓展到漫画、绘本、海报、广告、电影乃至于互联网弹幕及二次元文化。[19]

文图学的提法，正与人工智能的进展历程相近。

1950年图灵的文章“Computing Machinery and Intelligence”还属于思想实验性质。1956年约翰·麦肯锡（John McCarthy，1927—2011）等人组织了达特矛斯夏季人工智能研究计划会议（Dartmouth Summer Research Project on Artificial Intelligence），首度订定“人工智能”（Artificial Intelligence）的名称。人工智能的开发一直到1974年自然语言（Natural Language Processing）研究才有所进展。[20]有意思的是，比科学家发明超前的科幻小说和电影仿佛已经预见了未来，1968年的电影《2001太空漫游》（2001: A Space Odyssey）[21]中，便有可以和太空人对话的人工智能电脑HAL 9000，片中还使用了1961年IBM 7094首部编程电脑唱的歌曲Daisy Bell，而人类在1969年才初次成功登陆月球。

1970到1980年代，人工智能的研发十分缓慢，科学家发现人工智能必须基于大数据语料库，1970年代学术上的“语言学转向”促进了对自然语言的认识，让电脑学习人类的语言，并且探究人类的大脑如何学习和记忆、反应语言，便得以帮助电脑反复进行机器学习。

图2 Google Books Ngram Viewer呈现的单字使用情形

与此同时，“文本”概念的适用范围增广，以及“图像”的指涉覆盖超出具体的绘画，标志着文明的发展。我输入文图学常用的单字text（文本），image（图像），picture（图画），literature（文学），poems（诗），painting（绘画），放入Google Books Ngram Viewer的统计，查询1800年到2018年在书籍里出现的频率（图2），发现1988年是一个关键节点。从1988年起，text和image比其他语词更经常被使用，而且text比image使用还频繁。在1945年以前，使用text少于使用picture。

可以说，1988年以后，人们提高关注和叙述text、image，这现象在1995年Windows 95的使用者界面图形化（GUI, graphical user interface）达到更具体的实行。

1995年8月24日，微软Microsoft发布了新的电脑作业系统Windows 95。Windows 95用画面图示（icon）指引操作。即使图示下方有文字说明，文字的字体较小，不像图示直观；而且图示全球统一，不因语言文字受阻碍。于是人们开始逐渐因使用图形化界面而习惯看图行动。

受惠于演算法的进步，到1997年IBM深蓝战胜国际象棋冠军，又推动了人工智能的发展。2006年关于深度学习神经网络（Deep learning neural network）的理解，加速了人工智能的研究。2011年IBM Watson，苹果的Siri能回答人的提问。2013年语音识别（Speech Recognition）和图像识别（Image Recognition）的能力直接催生了此后两三年聊天机器人如Eugene Goostman、微软小冰和人工智能写作平台，如腾讯财经的Dreamwriter、新华社的快笔小新、第一财经的DT稿王、清华大学的薇薇作诗程序等。

笔者于2014年创发文图学，[22]乃有感于许多新媒体的文化生产无法被传统的文学与美术范畴含括，并且发现互联网每日大量制造文本，需要新的方法论和诠释策略，这些文本（text），无论是文字还是图像，都是以“图”（image）的形式呈现。2015年英国《牛津字典》（Oxford Dictionaries）选出了一个带着泪滴的笑脸（face with tears of joy），“绘文字”（emoji）符号为年度“字”（word of the year），即认定“字”也是图像。

文图学和人工智能都依赖图像而诠释和产出文明的成果，本文在此脉络中，尝试以人工智能生成文学的机制再加推想。

二、人工智能（AI）文学生成

人工智能生成诗的机制大致有两种形式，一是以“薇薇”为代表的大数据语料库提取，主要生成旧体诗；另一是经由图像识别物体加上大数据语料库，比如微软小冰，主要生成白话诗。

人工智能写诗的程序在2006年深度学习神经网络研究开发之后快速进展，2011年台北诗歌节推出了“诗的自动贩卖机”，人们可以依主题选择想要写作的诗类型，并依指示回答问题，填写关键词，就能制造出一首白话诗。

2016年3月20日北京清华大学语音与语言实验中心（CSLT）[23]宣布，人工智能“薇薇”的25首旧体诗制作通过图灵测试。和真人进行竞艺，“薇薇创作的诗词中，有31%被认为是人创作的。不过，在本次比赛中，薇薇创作古诗的水平还是未能超越现代人类诗人，双方的比分为2.72（满分5分）：3.20分”。[24]

且看薇薇作的《落花》诗：

红湿胭艳逐零蓬，一片春风细雨濛。燕子不知无处去，东流犹有杜鹃声。

诗意明显脱胎自杜甫《春夜喜雨》：“好雨知时节，当春乃发生。随风潜入夜，润物细无声。野径云俱黑，江船火独明。晓看红湿处，花重锦官城。”尤其使用“红湿”一词，更为确凿。在格律方面，这是一首平起首句入韵的七言绝句。平仄规定应该是：

方框中可不拘平仄，薇薇除了第一句之外，其余三句都合乎格律。不合格律的是“湿”字当为入声；同句“逐”字也是入声，薇薇押对了。[25]

后来清华大学自然语言处理与社会人文计算实验室（THUNLP）[26]更推出了“九歌─人工智能诗歌写作系统”，[27]该系统采用最新的深度学习技术，结合多个为诗歌生成专门设计的模型，基于人类诗人创作的诗歌进行训练学习。九歌具有多模态输入、多体裁多风格、人机交互创作模式等特点，不但能作格律的七言五言绝句和律诗，还能作藏头诗、集句诗，并且能填词，开放给公众一过当诗人的滋味。

微软小冰2014年“出道”时，是个聊天软件。经由和用户文字沟通，加速积累词汇量和深度学习自然语言处理。工程师设计她是个17岁的高中生，天真卖萌，一些用户和她聊天时出现内容挑逗的“重口味”对话，聊天记录是否会泄露也一度令人担心，以致多次被禁封。

尽管如此，花了100个小时，1万次迭代，学习1920年代以来包括胡适、闻一多、余光中、北岛、顾城等519位中国现代诗人的作品之后，小冰生成了5万句诗，并从中选取佳作，自行为诗集命名，而后于2017年出版实体纸本书。[28]

我读了小冰的诗集，猜想她如何写诗。收录的诗篇仿佛依循一套模板，每首两段，每段四行。合观搭配的图片和诗句，似乎作者写的是“读图诗”，也就是从图像的元素里抽取相应的语词，尤其是实体的景物，比如大树、建筑、冰雪、高山、城市，直接呈现在诗句里。抽象的景物有些被实体化，比如“由下往上望，螺旋状的阶梯交会处像个眼睛”，诗里便出现“眼睛”一词；“焦点模糊的花海像是织绢”，诗的题目是《春花织成一朵浮云》。

小冰的作诗系统也在网站公开，让大众上传图像，小冰生成创作初稿。[29]这种读图作诗的步骤和我们大量阅读储备书写根柢，再因情景触动而创作一样，作者借图像、形象而凝聚成意象。而且也有如东方绘画常搭配的题画诗，诗人观画起兴，写诗咏画或抒怀。

为了试试小冰的解图功夫，我用“文图学”的英语名称“Text and Image Studies”制成文字云（word cloud），再把文字云剪裁，存为图像，上传小冰写诗的网站，看她能生成什么诗篇。

结果小冰生成了以下三首诗（皆于2020年8月27日）：

第一首：

热风已随着太阳升腾蒸发

枫叶卸下了夏天的绿装
海边有人等待着
曲水是浩渺的苍海
到世界文字的技术问题
去浇植人们幸福的花园的边沿
在晴空下大声欢笑
这地面的山岗照着太阳的光

第二首：

赞颂夏天温暖的风

但是神秘的天空的云
弥漫着破灭的人们的舞台
为璀璨的阳光唱着欢欣的赞歌
今夜才是世界文字的技术问题
有你的世界更加美好
这正如天空季候的炎凉
迷上了醉人的月光

第三首：

回声在太阳的光影里

今夜才是世界文字的技术问题
夏天我常梦想采撷蔷薇
捕捉到那一朵花瓣
凉凉的夏夜里透出点点星光
她眼看着太阳的光热
让沙漠里的花更加灿烂
弱小的人们关在小草的花心
无数的世人相信这个
赶上了你脚下的轻快的兰花
像是人们的理想并没有沾恋
月光荡漾着无限的想象
几双燃着火焰的人们的心头
他忽然发觉了人们灵魂的哀息

每一首的第一句是题目，有8行（3+3+2行）的《热风已随着太阳升腾蒸发》、8行（4+4行）的《赞颂夏天温暖的风》和14句（4+4+6行）的《回声在太阳的光影里》。

2020年12月16日，我应台湾东华大学邀请演讲，便将这三首诗和听众分享，并让大家投选，是否认可小冰生成的文字就是诗。同时，我举了诗人杨牧在《一首诗的完成》里谈的，对于诗的思考和定位：

诗不是吟咏助兴的小调，诗是心血精力的凝聚；诗不是风流自赏的花笺，诗是干预气象的洪钟；诗不是个人起居的流水帐，诗是我们用以诠释宇宙的一份主观的、真实的记录。

小冰的诗，达到这样的水平吗？

50位听众投选的结果：50%赞成，28%反对，22%表示不知道。这可以说是比“盲测”的图灵测试还进一步的测试。已经知道“作者”是人工智能，不存在无法判别是人类或机器的问题，因此，是纯粹从诗学的角度判断。

三首长短不一的小冰合成诗篇，都出现了相同的句子：“世界文字的技术问题”，似乎暗示了虚拟世界和人类写作的文字或许有摩擦新火的可能。微软（亚洲）互联网工程院在网上公告：“未来世界，每个人类创作者的身边，都将有一个人工智能少女小冰，而你今天已经拥有。”至于版权问题，网站也明示：“微软小冰宣布放弃她创作的这首诗歌的版权。这意味着，你可以根据她的内容，创作并发表你最终的作品，甚至不必提及她参与了你的创作过程。”这其实加深了人们的顾虑，也使对于“原创”的判断更具挑战性。

三、AI 文学生成的原理和运用

文图学重视大脑对图像的接收和判读，以及判读后的反应和感知，如前所述，人工智能的飞跃发展也是基于对人脑的研究理解。以小冰生成诗为例，输入图像，通过识别，交会储藏的大数据语料库现代白话诗，然后输出诗作，其中关键的过程，便是如何识别图像。[30]

根据参与微软小冰开发团队的林守德教授介绍，[31]微软小冰的生成诗原理和步骤大致如下，我们拿《赞颂夏天温暖的风》的第一段为例说明：

赞颂夏天温暖的风

但是神秘的天空的云

弥漫着破灭的人们的舞台

为璀璨的阳光唱着欢欣的赞歌

1．图像输入，由卷积神经网络（Convolutional Neural Network, CNN）处理。人眼看到的物象在大脑中是各种各样的像素，先分辨出像素的边界，聚焦和区隔出不同的物象，利用卷积神经网络把平面的色点像素立体化，分析对应出同类物象，得知图像中的物象是什么。

2．图像辨识，预先处理图片关键字→物象+形容→前后递回（recursive generation），正向与反向生成模型→造句。辨识出图像之后，从大数据中提取相应的关键字和形容词句。比如用“Text and Image Studies”聚合成的文字云，小冰的大数据中只有汉语，但是可以分辨出文字云的图像，由云而引申出风、天空、日（阳光），加上形容词句，成为神秘的天空的云、温暖的风、璀璨的阳光。接着通过前后递回（recursive generation），正向与反向生成模型，也就是和前述词句同义或相反的词句，比如赞颂/破灭；神秘/璀璨，于是便有了“赞颂夏天温暖的风”和“破灭的人们的舞台”，以及“神秘的天空的云”和“璀璨的阳光”两组四句。

3．进入N-gram（N元语法）语言模型，找出词频使用情况。小冰制造出的词句可能不合乎人类语法，从词频中整理逻辑结构。

4．连续句：将上一句的资讯转化成编码，传给下一句。注意两句之间的意义关联，作成诗的样态。

AI经由图像辨识而生成文学的过程，可以帮助我们思考文学创作的动力和运思，也就是《文心雕龙·物色》所云：

是以诗人感物，联类不穷。流连万象之际，沉吟视听之区；写气图貌，既随物以宛转；属采附声，亦与心而徘徊。[32]

一般人书写可能只停留在第一阶段卷积神经网络输入和辨识物象的层次，产生对应的物象指认说明和基本的描述形容，缺乏前后递回的正向与反向生成模型参考。如果平时阅读积蓄的语汇量不够丰富，便词穷语涩，文字枯燥，再加上逻辑思维训练贫乏，前言不搭后句，通篇不连贯的毛病也就显而易见了。

四、AI 文学生成的文图学思考

AI作诗犹如读画诗和题画诗，我们不妨以现存较早、诗画同在一幅的宋徽宗（1082—1135）《蜡梅山禽图》为例，再深入探讨AI和人脑读画作诗的异同。

文图学关注“文学图像化”“图像文学化”及诗画关系。“文学图像化”包括书法、插图、以文学作品为绘画题材的诗意图等；“图像文学化”包括描写图像的文学作品，例如书法文学、题画文学等。[33]题写在画幅上的诗文，则具体实现了诗画相辉映的视觉美感。《蜡梅山禽图》结合了绘画、题诗、书法、钤印，是文图学研究的绝佳例证。[34]

《蜡梅山禽图》绢本设色立轴，83.3×53.3厘米，现藏台北故宫博物院。画一株腊梅，梅枝由右下向左上延伸，呈现带有动感生意的S形曲线。梅花点点，左侧的梅枝停伫一双白头翁鸟，鸟的位置正落在全画的中央，鸟的目光朝向左侧，与向上生长的梅枝形成十字的平衡构图；右边那只鸟的尾端斜向左下，指往题诗。梅树下，两株着花的重瓣水仙，[35]花间有黄蜂飞舞显示此时正是初春季节。

此图有宋徽宗瘦金体书法风格的落款“宣和殿御制并书”上钤“御书”印和“天下一人”花押。同样是瘦金体书法风格的题画诗：

山禽矜逸态

梅粉弄轻柔

已有丹青约

千秋指白头

虽然不能确定此图为宋徽宗亲笔书画，但是符合其基本的特征和美学意趣。如果把这幅画去除文字，交给小冰，会写出怎样的诗呢？且看其中一首：

鲜丽的春光在天空里兜圈子

你在寒冷的天空里发呆

将要现出一个美好世界的光明

山谷中传来人间的阳光

冰雪的天空里面

温暖的太阳下的花朵欣欣向荣

可以想见，小冰辨识出画中有花朵，而且可能由于树干无叶，推想画的是寒冷时节。《鲜丽的春光在天空里兜圈子》完全没有指认画中的植物和鸟类，而这并不困难，目前的人工智能已经具备对动植物辨识的能力，也就是说，《蜡梅山禽图》题诗的名词：梅、白头翁、指称绘画的“丹青”都可能出现于AI生成诗中。不过，含有双关意味的“白头”可能只有人类诗人才使用得自然流畅。“已有丹青约，千秋指白头”表露了艺术家对绘画毕生不渝的深情，这种带有联想、隐喻的文字，和诗画融通、观者与画家同情共感的心怀，完全超越机器。

结　语

本文从文图学视角思考人工智能生成诗的原理和特色，或认为人工智能生成诗是一种人类发明的“机器代工”；或对这种当代的“奇技淫巧”嗤之以鼻，甚至怀疑利用人工智能生成文学艺术，加诸开发者放弃版权，鼓励使用者迳取合作，恐怕令艺术伦理匮乏，导致“欺世盗名”之嫌。笔者引杨牧之语再思：

所谓真实，乃是一生经历体验的具象全部。美和不美历历在目，来不及转化为诗，只停留在散文的层次；而所谓‘诗’，指的是那些整理过的部分，转化提炼，将人间一切美与不美取来照明。在艺术的篇幅中企及抽象境界。往往也就有美存在于‘完成的内容’中。它不是具象的素材，是活泼生动于抽象形态下的艺术，它是诗。这二者不可能偏废其一，诗人一生的阅历正是‘诗与真实’之交织，诗是真实，无诗也是真实，所以真实是真实。

否则我们不如也附和另外一种人的说法：诗是虚幻的，无诗而营苟扰攘的一生又何尝不是虚幻？庸碌度过的岁月，或甚至豪情万状完成的一生，又何尝不是虚幻？真实是虚幻。[36]

艺术创作出于真实还是虚幻？在处于后现代、后真相的当今，排除和斥责人工智能合成艺术将会和世界脱节，与其负面评价，何如援以为助手。从人工智能合成艺术的过程理解人脑的无限创造可能，继而肯定人类的文学艺术无可取代的价值。

其中值得关注的要项之一，是人类语言和文字表述的“明指”和“隐喻”多管而出。同音谐音的双关使用，物象因文化积淀、历史传衍而孕育的意象内蕴，以及托物言志的写作动机等，这些都是人工智能被动输入图像，产生“像诗的文字”组合所无法企及的深度。

近年新兴的人类和人工智能合作的写作实验，例如“共生纪”，或许是人机共同发展文学的一种可能方向，其成果有待更多检验和探讨。[37]本文分析的人工智能写作历程，还能够提供写作各阶段的科学依据，甚至建构模板套路。即使当不成伟大诗人，稍稍满足作诗的想法，未尝不是一种当代人生趣味。[38]

Text and Image Studies with Artificial Intelligence Poem Writing

I Lofen

Abstract: Since the 1950s, “artificial intelligence” developed by scientists has made leaps and bounds. Artificial intelligence can not only assist or replace human limbs, perform physical labor is also analogous to the human brain, which generates works of art such as literature, music, and painting. “Text and Image Studies” attaches great importance to the image pair the influence of cognitive judgment and action is similar to the principle of artificial intelligence generative art.

This article uses Microsoft Al system Xiaoice as an example, l disassembled the process of Xiaoice’s poetry generation model from the perspective of Text and lmage Studies and juxtaposed it with the “Birds on a Blossoming Yellow-plum Tree” painting attributed to Emperor Huizong of the Northern Song Dynasty, thinking about the essence of human art that cannot be replaced by artificial intelligence.

Keywords: Text and Image Studies; Artificial Intelligence; Microsoft Al System Xiaoice; “Birds on a Blossoming Yellow-plum Tree” Painting

（编辑：邱伟云）

注释：

*本文原为2020年12月16日在台湾东华大学演讲的内容，后写成专论于2021年12月11至12日南京大学主办的“南京论坛”宣读，听取与会学者意见修订。感谢本文的两位匿名审查教授惠赐评语，本文再依评语增补完成。

[1]小冰：《阳光失了玻璃窗》，北京：北京联合出版公司，2017年。

[2]1950年图灵（Alan Turing，1912—1954）提出了假设机器能经由电传装置与人对话而不被察觉出它的机器身份，便是通过测试，后人称为“图灵测试”（The Turing Test）。Alan Turing, “Computing Machinery and Intelligence,” Mind, vol. 49,pp.433-460.

[3]衣若芬：《薇薇作诗》，新加坡《联合早报》“上善若水”专栏，2016年4月23日。

[4]小冰等：《花是绿水的沉默》，北京：中国青年出版总社，2019年。

[5]张鹏禹：《当人工智能也“拿起笔”留给人类的领地还有多大》，2019年09月10日，《人民日报（海外版）》，http://media.people.com.cn/n1/2019/0910/c40606-31345283.html，2021年10月1日。

[6]邱志杰主编：《或然世界：谁是人工智能画家小冰？》，北京：中信出版社，2020年。

[7]佚名：《微软小冰今日从上海音乐学院音乐工程系毕业，师从于阳、陈世哲》，2020年6月29日，腾讯网：https://new.qq.com/rain/a/20200701A035LA00，2021年10月1日。

[8]https://www.youtube.com/watch?v=XUs6CznN8pw，2021年10月10日。

[9]https://obvious-art.com/portfolio/edmond-de-belamy/，2021年10月10日。

[10]可参考尹倩：《接受·整理·生成：“数字人文”视域下文学研究方法转型的初步探讨》，《数字人文》2020年第3期。本文聚焦于文学写作，关于人工智能在新闻媒体的影响，参看Francesco Marconi, Newsmakers: Artificial Intelligence and the Future of Journalism, New York: Columbia University Press,2020。

[11]例如黄鸣奋：《从电子文学、网络文学到数码诗学：理论创新的呼唤》，《文艺理论研究》2014年第1期。

[12]例如汪凌云：《论人工智能文学创作的“伪突破”》，硕士学位论文，华中师范大学，2019年。

[13]缪小静：《人工智能文学制作技术研究》，硕士学位论文，杭州师范大学，2021年。

[14]莱辛著：《拉奥孔》，朱光潜译，北京：商务印书馆，2013年。

[15]钱锺书：《中国诗与中国画》，香港：龙门书店，1969年。

[16]Roland Barthes, essays selected and translated by Stephen Heath, Image, Music, Text, New York: Hill and Wang, 1977.

[17]W. J. T. Mitchell, Image Science: Iconology, Visual Culture and Media Aesthetics, Chicago: University of Chicago Press, 2015.

[18]John Bateman, Text and Image: a Critical Introduction to the Visual-verbal Divide, London, New York: Routledge, 2014.

[19]关于文图学的内涵、方法论和实践步骤，详参衣若芬：《春光秋波：看见文图学》，南京：南京大学出版社， 2020年。衣若芬：《图像．形象．意象：当中国古典文学研究遇到文图学》，《文学论衡》 2020年第 36期。衣若芬主编：《东张西望：文图学与亚洲视界》，新加坡：八方文化创作室， 2019年。衣若芬：《五张图认识文图学》视频， https://www.bilibili.com/video/BV1xg411o7wW/?spm_id_from=333.999.0.0&vd_source=ff546fe350ebdb7b58d2854bbb174ff5， 2022年 11月 1日。

[20]Darrell M. West, John R. Allen, Turning Point : Policymaking in the Era of Artificial Intelligence, Washington, D.C.: Brookings Institution Press, 2020, pp. 1-25.

[21]史丹利·库布里奇（Stanley Kubrick， 1928—1999）导演，与亚瑟·克拉克（Arthur Charles Clarke，1917—2008）合作编剧。

[22]衣若芬：《“文图学”的建构之路》，衣若芬主编：《学术金针度与人》，新加坡：八方文化创作室， 2015年，第 139—140页。

[23]清华大学信息技术研究院语音和语言技术研究中心，http://cslt.org/。

[24]佚名：《清华大学实验室作诗机器人“薇薇”通过图灵测试》，2016年3月21日，https://www.riit.tsinghua.edu.cn/info/1046/1866.htm，2021年10月10日。

[25]衣若芬：《薇薇作诗》，新加坡《联合早报》“上善若水”专栏，2016年4月23日。

[26]http://nlp.csai.tsinghua.edu.cn/，2021年10月10日。

[27]http://jiuge.thunlp.org/，2021年10月10日；孙茂松：《诗歌自动写作刍议》，《数字人文》2020年第1期。

[28]关于微软小冰写作的研究，还可参看程羽黑：《人工智能诗歌论》，《华南师范大学学报（社会科学版）》2019年第 5期；王泽庆、孟凡萧：《人工智能文学的诠释困境及其出路》，《安徽大学学报（哲学社会科学版）》， 2020年第 3期。

[29]https://poem.msxiaobing.com/.

[30]关于人工智能生成文学的过程或许对熟悉电脑科学和数字人文的读者是一般常识，有鉴于仍有大多数读者尚未明晰，因此本文再细述。

[31]林守德：《当人类智慧碰到人工智慧》， http://case.ntu.edu.tw/sciactivity/20180929-2/， 2020年 11月10日。

[32]刘勰著，黄叔琳注，李详补注，杨明照校注拾遗：《增订文心雕龙校注》，北京：中华书局， 2012年，第 563页。

[33]衣若芬：《畅叙幽情：文图学诗画四重奏》，杭州：西泠印社出版社，2022年。

[34]本文的重点不在诗语言的新旧，而是从图像引发诗的经过。微软小冰生成的是白话诗，《蜡梅山禽图》的题诗是旧体诗，本文的匿名审查教授之一建议对比同样是旧体诗的作品，以人工智能生成平台例如“九歌”为例，笔者虽不反对这种方式，但是站在强调观察通过图像来书写 /生成读画诗的立场，“九歌”缺乏图像作诗渠道。至于选取同样是读画诗的白话诗写作，除非作者明确记录或附加所题写的图像，许多现代的白话读画诗无法对应具体的图像，也就失去文字的图像依凭。

[35]《石渠宝笈三编》著录此图“下荫山矾一本”，一些谈及此图的文字也依随说梅树下的花是山矾。细观那两株植物，比对山矾的图像，例如清董诰画《二十四番花信风图册》的《大寒三候山矾》可知《蜡梅山禽图》的花并非山矾。笔者比对了古代花鸟画，认为应该是属水仙一类，后发现陈韵如博士也有同感，参看陈韵如：《尽物之情态：北宋题画活动与徽宗朝花鸟的画史意义》，《台湾大学美术史硏究集刊》 2015年第 39期。

[36]杨牧：《诗与真实》，《一首诗的完成》，台北：洪范出版社， 2004年，第 214页。

[37]“‘共生纪’是传茂文化 x创新工场共同发起的一次 AI-Human后人类科幻写作实验，是中国第一次由主流文学作家、知名科幻作家、网友与 AI共同创作科幻文学作品的趣味科普项目，通过环保、人机关系、性别、青年创新、文化多样性等主题，进行人类智能和人工智能共生时代的文化实录，也是一场对当下和未来的反思与展望。”引用自网站 https://zhuanlan.zhihu.com/p/317538959， 2021年 12月 5日。 [38]衣若芬：《跟 AI学写诗》，新加坡

前 言

一、文图学（Text and Image Studies）与人工智能（AI）

前　言