中国社会科学杂志社

首页>中国社会科学报>特别策划>特别策划内容

人工智能时代的艺术创造性

2020年04月03日 00:57 来源：《中国社会科学报》2020年4月3日第1900期作者：陈静

　　近年来，人工智能领域深度学习的蓬勃兴起，特别是生成对抗网络所呈现出的强大自主学习能力，使人工智能的拥趸们开始为“人工智能可能具有创造性”而欢呼。尤其是Alpha Zero在24小时内就击败了世界冠军水平的国际象棋程序Stockfish，让人们似乎看到一个具有强大能力的人工智能。IBM在2016年推出了第一个AI创作的电影预告片后，开展了有关AI创造性的专题研究。他们与30位专家和思想引领者交流，指出人工智能很容易随机生产出一些新东西，但是很难生产出一些既新亦超乎预料且有用的东西。人工智能是否有其独立的创造性，或者只是扮演辅助的、增强人的创造性的角色，这一问题由来已久。图灵在著名的《计算机器与智能》中指出，关于机器是否能写十四行诗或者创作协奏曲的问题，只要机器在对话过程中能够做出令人满意的回答并持续进行对话，就可认为这是一种思维过程。他还指出，之所以哲学家和数学家认为机器不可能具有创造性，是因为他们首先认定创造性是人类心灵所特有的心理活动。在今天看来，图灵在1950年所做的论断依然有其有效性，他其实将我们之前所提出的有关“人工智能与创造性”“人工智能与人的创造性”等问题放在元问题的位置——我们究竟应在什么层面来讨论创造性？我们是否可以以人的创造性来规定人工智能的创造性？

　　创造性，一个人类谜团？

　　人类一向以富有创造性而自居、自傲。什么是创造性？由于该议题讨论多涉及文学批评、实验和认知心理学、精神分析学、哲学、艺术、人工智能等学科背景，所以定义也多种多样。但一般来说，创造性主要指两种能力，即生产和使用原创的、不同寻常的观点的能力，以及制造某种新的或有想象力的东西的能力。在更严格的意义上，创造性是指具有生产和创造能力的主体，以及相应行为所产生的结果必须具有“新意”及价值。创造性在个体层面更多是一种心理以及发生动机，往往与神秘色彩的、无理性的、直觉化和想象性的心理状态和行为联系起来。人们所津津乐道的各类“灵感迸发”的“创造性时刻”，往往都是在像床、公车和浴缸（Bed, Bus and Bath，简称“3B”）这样一些不可思议的地点发生的，比如阿基米德从浴缸里获得灵感，阿加莎·克里斯蒂喜欢一边泡澡一边吃苹果。因此，亚瑟·库斯勒用“异类联想”（bisociation）来形容创造性的产生过程。

　　关键时刻，新见解的突然出现是一种直觉行为。这样的直觉包装了奇迹般灵光一现或理性的捷径。实际上，它们可能是以一种沉浸式的链条关联起来的，只不过这条链条只有开始和末梢是在意识的表层上可见的。就像潜水员受着不可见的链接引领，在一端潜，没在另外一端浮现（A. Koestler, The Act of Creation）。那么，脑科学是否可以帮助我们发现隐没在水面之下的线索？虽然科学家们认为大脑的神经活动应该可以解释一切的行为，但是目前基于研究手段的限制，我们对于创造性的神经基础依然缺乏明确的认识。目前关于创造力脑神经基础的研究主要从脑结构和脑功能两方面进行。创造力与脑结构的关系主要从脑的生理解剖和脑结构成像两方面展开，创造力与脑功能的关系则主要从任务取向和个体差异取向展开（沈汪兵、刘昌、陈晶晶，《创造力的脑结构与脑功能基础》）。由于目前的研究主要聚集在功能呈现研究，结构影像研究相对比较少，也没有更多地突破功能性表现的关联性。也就是说，研究者或许从行为研究、推理及问题解决过程中了解大脑运作的一些机制，但是依然有很多困难与障碍。有关大脑是如何能够产生创造性，或者某人如何得以富有创造性，以及不同类型的艺术活动所具有的创造性何以不同，依然是未解之谜。

　　有学者还指出，创造性是一种个体与社会文化语境之间的互动过程的产物（Mihaly Csikszentmihalyi, Creativity: Flow and the Psychology of Dis-covery and Invention）。创造性可以通过一些技能习得。如在科学和技术领域，创造性体现为一种实践过程（流程）中的有用性；而在人文、艺术或者神学领域，则体现为直觉性的、敏感的、转瞬即逝的内在积极价值。人文艺术传统更为共识创造性的形成提供了社会化语境。18世纪浪漫主义、19世纪理想主义建立了作为普遍概念的创造性与心灵之间的关系。柯尔律治、华兹华斯等尤其强调，想象力作为一种表达行为的创造性，在创造者体验中具有重要作用。创造性由此与“天才”“想象力”“原创”等一系列概念绑定在一起，成为人文艺术中核心概念。同时，随着印刷书的大规模流行，职业作家群体慢慢形成，作者著作权立法以及印刷工业的产业链逐步完善，专业的编辑、出版商、销售商以及评论家的分工日益明确，使文学界成为一个自足的群体和圈子。因此，创作者、版权、原创性、创造性得以在这样的社会语境中浮显。

　　让人工智能具有创造性

　　尽管关于创造性的认识和研究还在继续，但人类也一直努力在机器中创造新的可能，让计算机像人一样具有智能，从而具有创造性。在人工智能发展早期，就有人开始探索用人工智能来介入艺术创造性活动，比如写诗。1966年有一个名为Elliza的人工智能程序通过模拟病人（用户）与精神治疗医生（Elliza）之间的对话来探索计算机会话能力的极限。Elliza的非凡之处在于它能够运用一种理性关联的对话能力，而不需要任何复杂的语言—句法分析技巧。而Elliza的理性关联能力主要依赖于一套虚假的智能机制，这套机制包括对关键词的识别、循环用户的输入、对经典公式的回应及突然改变主题等。1993年，斯科特·特纳创造了“吟游诗人”（MINSTREL）系统，将计算机作为一种基础模型的生成器。它的整个故事系统是基于作者—层级的问题解决模型，试图通过实现目标的四个重要的要素（主题、戏剧性、一致性和呈现）来生成像“亚瑟王”的短篇小说。特纳将这基于创造阐释技术称为“转化—调用—适应方法”（Transform-Recall-Adapt Methods）。每个TRAM都集成了一个简单的问题转换，该问题转换在问题空间中搜索新知识，并通过相应的调整将新知识应用于问题，可以使任何发现的知识适应原始问题。通过使用TRAM扩展问题解决过程，MINSTREL能够发明出有用的新问题解决方案。通过将创造力纳入召回过程，MINSTREL使创造力可用于任何认知过程，并允许使用多个TRAM进行创造力“跳跃”。但就其生成的文学效果而言，这个创造过程所生成的模仿文本尚处在初级阶段。无论是“吟游诗人”对传说故事逻辑的模仿，还是Elliza对口头对话模式的模仿，都是计算机逻辑运算、推理和程序设计。尽管近年来像微软小冰、清华大学“九歌”系统等在诗歌创造方面取得了更进一步的发展，但这些项目的最终目的并不是生成优美的文学作品，而是通过这种方式实现对人类智慧与思维的探索。这种创造性本身是经过精心计划和设计的，而且对于人类而言，写一首像人类写的诗歌，这本身并不是一件多么具有创造性的事情。

　　然而，生成对抗网络（Generative adversarial network，GAN）的出现，似乎让事情变得有些不同。作为一种将博弈论引入生成模型的机器学习方法，GANs的最初目的设定就是创造艺术图像，其内部设定了两个可以互相交流的神经网络，一个生成器（generator）和一个判别器（discriminator）。两个模型通过对抗过程同时训练。生成器扮演着类似“艺术家”的角色，学习创造看起来真实的图像，而判别器则扮演“艺术评论家”的角色，学习区分真假图像。而最有意思的是，在评论家所鉴定的图像群中，既包括训练数据集中给定的人创造的图像（真图像），也包括了GAN程序里的艺术家创造的新的图像（假图像）。因此在GANs的模型中，计算机不仅作为一种方法在帮助人类做新的事情（创造新的、人类世界中前所未有的图像），同时还在做看起来像创造性的事情（从来没有这样的一种方式去生成艺术图像），而且还能够识别创造性（内部模型设定了这样一种自我生成与鉴定环节）。

　　2018年，一幅通过GANs生成的画作创造了第一幅人工智能画作的拍卖纪录。这幅名为《埃德蒙·德·贝拉米肖像》（Portrait of Edmond Belamy）画作的生成者是三位来自法国的年轻人。他们训练机器学习了1.5万张14世纪至20世纪之间的肖像画后，生成了一批图像，再请艺术方面的专家判断，选择了一幅看似格伦·布朗风格的画作打印、签名。尽管在程序编写、数据训练、处理过程和判断选择的过程中，都有人的参与，但程序还是被赋予了更大的自主性，并开始超出了人类所设想的关于创造性的理解。另一位青年艺术家罗比·巴拉特（Robbie Barrat）实际上是生成《埃德蒙·德·贝拉米肖像》这幅画的数据模型的编写者。但与《埃德蒙·德·贝拉米肖像》的生成者的方式不同，罗比给了机器更多的自由。在训练机器学习大量裸体画之后，他通过GANs生成了一批裸体画作。尽管他觉得这些画作并不像训练数据中的那些裸体画，但他并没有试图去修改程序或者让专家判断来改进结果。相反，他认为结果证明机器在学习的过程中是失败了：机器并没有学到裸体绘画中所有的正确属性，相反地，却掉入了局部极小值（a local minimum），从而产生出了超现实的肉团。因此，罗比提问：“这是机器看人的方式么？”尽管罗比的作品没有满足他关于裸体画的期待，但他的失败或许帮助我们发现了一种机器的“无意识”创作：是否算法在这个过程中根据它所“学习”到的艺术生成了它所“认为”的艺术作品？也就是说，这个过程是否体现了一种机器的创造性呢？答案我们尚不得知。

　　与此同时，我们还应关注，人工智能所具有的艺术创造性，不能脱离人工智能所在的社会语境。实际上，艺术作为文化和人工产品，与社会文化语境深度交织，很难将艺术单纯地从社会语境中剥离出来，仅仅讨论其所具有的技术或者哲学上的意义。比如《埃德蒙·德·贝拉米肖像》就被质疑存在代码剽窃嫌疑。这幅画作的生成者使用了罗比公开的代码生成了作品、进行了拍卖获利，但并没有惠及罗比。然后由于代码本身具有的共享性，如何对待这样的生成作品的法律及经济权益，实际上也成了人工智能所无法解决的问题。

　　（作者单位：南京大学艺术学院）

责任编辑：常畅

重点推荐