中国社会科学杂志社

首页>中国社会科学报>特别策划>特别策划内容

传播学视野中的ChatGPT技术逻辑

2023年03月07日 10:07 来源：《中国社会科学报》2023年3月7日第2604期作者：张洪忠刘绍强

　　基于大语言模型开发而成的人工智能产品ChatGPT在推出后立即引起社会广泛关注，短短两个月内用户数量已经突破1亿。ChatGPT是OpenAI公司GPT-3.5模型的直接应用，通俗地说，GPT模型不同于以往以句段为单位的块状文本拼接生成方式，它从底层算法上实现了基于概率的“字词接龙式”文本生成，即通过大型语料库学习获得的语言模型来生成自然语言文本。本文从技术呈现特点、功能与行业影响三方面来分析ChatGPT的应用及发展。

　　拥有三方面技术呈现特点

　　从技术呈现特点看，ChatGPT是自然语言技术领域一个具有里程碑意义的产品，是算力提升的一个标志性成果。作为一个算力强大的对话产品，ChatGPT拥有三方面技术呈现特点。

　　一是面向开放域的应用。相比于任务型对话技术，开放域的对话技术难度要大得多。任务型对话有规定的范围和模式，积累一定数据的监督学习就可以有好的表现。而开放域是面向整个社会不同群体的不同对话内容，没有固定的应答格式。要形成有体验感的对话，与任务型对话相比，开放域就需要更复杂的对话技术和更大的算力模型。

　　二是ChatGPT表现为具有连续多轮交互对话的能力。根据用户输入的内容，ChatGPT能够在联系上下文的基础上，提供更准确、更贴合语境的回答。为了实现连续多轮对话，ChatGPT使用了一种称为“上下文学习”（in-context learning）的方法来训练模型——在每一轮对话中，它会将对话历史和当前用户的输入作为新的上下文，继续生成下一轮回答。多轮对话就解决了用户的体验感问题，可以形成连贯的交流感，解决了之前聊天软件只能进行单轮僵硬对话的问题，这是自然语言对话技术应用层面的一次大飞跃。从用户角度来说，多轮对话意味着机器和人可以进入到一定对话场景之中，对话可以连续进行，而不是一问一答式的、与前面无关联的单轮对话模式。

　　三是ChatGPT具有多模态信息生成的潜力。目前，ChatGPT定位为人工智能对话产品，支持文本、代码等模态，技术能力集中于自然语言处理领域。ChatGPT是大型语言预训练模型GPT-3.5在对话系统领域的直接应用，该模型未来可与其他模型或工具搭配使用，通过有效地生成与多媒体相关的文本描述，为多模态信息生成提供一种新的方法。

　　让普通用户直接与人工智能对话

　　从功能角度看，ChatGPT具有聊天、检索、知识服务、AI创作四种互联网功能，是一个具备复合功能的人工智能产品。作为一款现象级的人工智能产品，ChatGPT标志着人工智能领域自然语言处理技术从“To B”到“To C”的重大转变。此前，已经出现不少面向大众的对话软件，但这些产品在使用规模、体验感等方面都无法与ChatGPT相比。ChatGPT对话框样式的产品界面让大规模普通用户能直接与人工智能流畅对话。

　　一是对话聊天功能。作为一款对话模型，聊天陪伴是ChatGPT提供的基础功能，日常闲聊或专业交流对其而言都不在话下。由于流畅的对话体验，ChatGPT得以在与用户对话过程中建立社交连接，满足用户的陪伴需求，对话聊天功能将是ChatGPT与用户建立黏性的重要功能。从微软小冰等社交机器人的经验来看，人机对话将成为数字交流的一个重要组成部分，而社会也有这个需求。人与ChatGPT建立的准社会交往关系，是人文社科领域值得持续关注的一个命题。

　　二是信息检索功能。由于ChatGPT在自然语言处理方面的技术迭代，将为用户提供更直接更有效的信息检索内容。更进一步看，与现阶段的搜索引擎需要用户自己从检索结果中寻找答案不同，集成了ChatGPT模型的对话式搜索将直接为用户提供最优的信息检索结果。ChatGPT模型有助于打造下一代搜索引擎，如微软打造的新必应搜索（new Bing）在这方面已经走在了同行前列。新必应已经打破了搜索引擎多年来形成的产品形态，成为新的搜索形态的开始。

　　三是知识服务功能。ChatGPT的模型拥有1750亿个参数，用以训练的数据集包含数百亿个单词，规模超过45TB空间，类型涵盖网页、电子书、新闻文章、论坛帖子、电子邮件、社交媒体等各种文本数据。因此，ChatGPT聚合了人类世界的广泛知识，能够以问答形式提供知识服务功能。更重要的一点是，ChatGPT的大模型对当前知识服务网站的准确度和质量提出了挑战，如它可以完成程序代码等具有一定难度的知识服务，甚至可以完成大学生作业和考试等，其知识服务能力也会持续增强。

　　四是AI创作功能。ChatGPT的强大之处在于它的输出是真正生成式（Generative）的。ChatGPT基于字词的概率分布，在文本生成时根据给定的输入前缀，预测接下来的字词，并将其作为生成文本的一部分。所以，ChatGPT可以根据用户提供的主题或关键词，自动生成新闻报道、评论、诗歌等文本内容，还可以创作图像等。AI创作降低了艺术创作的技巧门槛，人类可以直接进入情感表达的艺术创作之中。

　　将云服务提升至智能时代

　　从行业影响看， ChatGPT兴起带来的影响非常广泛，也将云服务从数字时代推进到智能时代，智能化将显著提升各行各业的生产效率。未来用户对云厂商的需求将聚焦智能服务，是模型、框架、芯片、应用的全方面竞争。具体到相关产业，人工智能的产业竞争至少包含三个方面。

　　一是复合功能的竞争。通用型的人工智能是众多科学家不懈追求的目标，但目前的技术还很难接触到通用型人工智能。即使是ChatGPT也只是处于专门化人工智能阶段，技术框架和技术逻辑没有革命性的突破，更多是过去技术的集大成。但ChatGPT能够完成对话聊天、知识服务、AI创作等多种复合功能，这是在专门化人工智能技术阶段的技术聚合的突破。换言之，复合功能的人工智能产品将是未来的发展方向。

　　二是大模型的竞争。ChatGPT带来的一个思考就是大模型将成为下一步人工智能领域的重要形态，人工智能技术将更多地从实验室走向应用大模型。GPT初代模型拥有1.17亿个参数，GPT-2的参数数量增加到15亿个，GPT-3的参数数量更是比上一代多了两个数量级，达到1750亿个参数。参数越多，大语言模型的智能化程度越高，这方面的竞争也会愈发激烈。

　　三是大资金的竞争。据有关报道，继微软在2023年1月23日宣布向OpenAI进行第三轮达数十亿美元的投资后，谷歌母公司Alphabet在2月4日向ChatGPT竞品Anthropic投入3亿美元，以开发生成式人工智能。人工智能越来越需要强大算力的支撑。大模型离不开大数据，可以预见，未来人工智能模型的训练集规模将呈现陡然增长的趋势。面对更多维度和更高量级的数据，算力是必要的支撑。因此，如何获得强大的算力将成为未来的竞争方向，但其前提就是需要有足够的资金支持。

　　最后，对于ChatGPT当前的火热态势，人们也应该冷静思考。我们要认识到，以ChatGPT为代表的人工智能只是一种技术手段，ChatGPT是一种更高效、更便捷的技术，是新技术的迭代。ChatGPT代表的是自然语言技术的一个方向，但不是技术的全部，自然语言处理技术领域还有很多可以开拓的方向。进一步来看，我们要从技术逻辑来理解人工智能技术，而不能将认知与判断建立在好莱坞电影式的想象之上，否则，就会对人工智能产生无意义的恐慌，认为技术会很快颠覆人类社会；或者盲目地夜郎自大，以小模型充当大模型，认为短时间突击加班就可以完成技术突破。这两种心态都不利于技术创新。应对人工智能技术的挑战，需要按照技术逻辑来理解，在技术逻辑基础上建立技术创新的运行规则，我们才有可能真正赶上人工智能时代的技术迭代发展。

　　（作者单位：北京师范大学新闻传播学院）

责任编辑：张晶

重点推荐