发布日期:2023-07-03 来源:https://www.infoq.cn/article/85UCQYO6sJUC23W1JWBu 浏览次数:2610
ChatGPT 的诞生打响了现代 AI 军备竞赛的第一枪。以 GPT-4、ChatGTP、Bard 等为代表的大语言模型在全球各界引起了广泛关注。结合 ChatGPT 的底层技术逻辑,未来中短期内 ChatGPT 产业化的方向大致有四类:即智能客服、文字模态的 AIGC 应用、代码开发相关工作以及图像生成。其中,最适合直接落地的项目就是智能客服类的工作。
基于大模型技术所构建的智能客服正在从根本上改变传统的人机交互过程,大模型自动生成对话流程让运营智能客服更高效,可以提升复杂缠绕问题解决率、人机交互感知程度,以及意图理解、流程构建、知识生成等运营内容的效率。
如果单从产品渗透率层面来看,智能客服早在过去的七八年里就已经在电商、金融等等领域慢慢普及开来了。大模型带来的两个核心改变,一个是开发智能客服产品的成本大幅度下降,另一个就是用户体验的提升。
在 2016 年左右,做一个智能客服的原型产品要一个七八人的小团队耗时几个月的时间才能完成。有了大模型之后,现在可能一个工程师两到三天就做出来了。虽然将原型产品进行产品化需要更长的时间,但是和以前投入的人力和时间成本来比也是数量级层面的下降。
此外,过去的智能客服产品虽然也称之为“智能”但回答问题时会给用户留下“呆板”的印象,基本上回答内容都是预先写好的模版,能够回答的问题也有限。现在大语言模型能够根据用户的问题和对应的标准答案,给出个性化的答案,用户体验上已经不太容易分辨出是人工客户还是机器客服了,这一点上是很明显的提升。
随着新一代智能技术的突破,尤其是大模型可以为智能客服提供强大的自然语言生成能力,势必将智能客服推向更加智能化、高效化和个性化的新局面。
但不得不注意的是,尽管大语言模型在智能客服领域的应用前景看起来非常乐观,但在现阶段它的应⽤场景仍不成熟:主要表现在其⽣成结果不够稳定,且可信度也不够高。从实际应⽤场景来说,成熟稳定、经过市场验证的产品如果贸然引⼊达模型可能会给产品带来巨⼤的变化,甚⾄影响客户体验、浪费⼤量⼈⼒物⼒。
那么,想要将 LLM 大语言模型与智能客服产品进行结合,或者将前者落地于 ToB SaaS 应用软件领域,该如何着手搭建技术栈?大模型产品将如何赋能智能客服产品?带着这些问题,我们采访了华院计算技术总监兼数字人事业部联合负责人贾皓文和中关村科金智能交互研发总监、中关村科金智能客服技术团队负责人王素文,探讨 AIGC 在智能客服产品中的落地及未来发展趋势。
可以看到,目前 AIGC 智能客服的优势⾮常明显,随着 AIGC 智能客服技术的不断升级和完善,其在⾦融、电商、物流等领域的应用前景也是十分乐观的。
但在大模型掀起一场“新革命”革命之前,我们还需要为其铺好每一段路,不能操之过急。比如在智能客服产品领域中,对话通常是限定于特定业务领域和任务驱动的需求。但客户并不希望访客进来只是为了寻找⼀个超级智能、善解⼈意、会写会画的聊天机器⼈。对话内容必须在企业业务范畴内收敛,服务于客服和营销场景,解决和处理问题,不要浪费宝贵的资源。直接将 ChatGPT 这类大模型引⼊客服领域⽽不加控制,其结果难免会让人失望。
构建一款能够实际应用于业务中的大模型并非容易事,通常需要完成多项步骤,包括大模型选型、数据采集清洗、模型训练、模型测试与评估、模型微调、部署应用等。具体链路:
选择开源的通用大模型
收集领域数据,用领域数据继续训练开源大模型(学术上叫知识注入),得到领域大模型
整理领域任务的指令集合(可以半自动生成),用这些指令数据对领域大模型进行指令微调
筛选优质的真实场景的客服多轮对话数据,继续微调领域大模型(使领域大模型的对话能力增强)
收集一些安全相关的问题(例如涉及到政治、敏感话题、歧视等),人工给出符合安全要求的答案,继续微调大模型(对齐到人类的价值观、规范)
模型部署,对接智能客服系统进行应用
对话模型的训练数据应该具有足够的质量和多样性,以提高模型的泛化能力。对话数据可以通过爬虫、问答社区、对话记录等多种方式获得。在获得数据后,需要进行数据清洗和预处理,使得数据格式规范、数据质量高。
在准备好训练数据后,就可以开始训练大模型了。在训练过程中,需要选择合适的超参数,如学习率、批量大小、训练轮数等,以达到最佳的效果。另外,在训练过程中,可以使用分布式训练技术,以加速训练过程。
在模型训练完成后,需要对模型进行评估和优化,以提高模型的泛化能力和效果。常见的优化方法包括调整超参数、增加训练数据、使用正则化技术、剪枝模型等。另外,也可以通过模型蒸馏等技术,将大模型的知识转移给小模型,以提高小模型的效果。
在模型训练和优化完成后,就可以进行对话生成了。对话生成可以通过两种方式实现:一种是使用单个模型进行对话生成,另一种是使用多个模型进行对话生成。在使用单个模型进行对话生成时,需要对话模型具备记忆能力,即模型可以通过上下文信息,生成更加合理、连贯的对话回复。在使用多个模型进行对话生成时,可以利用模型的多样性,生成更加丰富、多样的对话文本。
在智能客服产品中,最需要内容⽣产能⼒的地⽅,莫过于知识库。⼀般⽽⾔,智能客服产品都具备这样⼏类知识库:内部知识库、机器⼈知识库和外部知识库。
对于内部知识库,⼀般将其定义成需要实时定位查询使⽤的知识库。由于企业的业务变化频繁,知识库的调整需要及时到位。传统的上传、编辑、整理等流程⾮常耗费⼯作量。引⼊大模型,可以协助⾼效智能的协助员⼯归类、⽣成知识库的类⽬及明细。同时,还可以增加对外部数据源的引⽤,并减少知识库的同步操作。⽤户在实际应⽤时,还可以给对知识点给出反馈,帮助知识库⾃动调节权重。
机器⼈知识库是⽂本和语⾳机器⼈能够回答访客问题的核⼼所在。机器⼈知识库的有效内容对于机器⼈的表现⾄关重要。对于未知问题的整理,需要智能客服使⽤者⼤量投⼊⼯作量。借助⽤户反馈对未知问题进⾏⾃动整理和关联,能节省很多知识库维护者的⼯作。同时,通过多机器⼈组合的⽅式,在⼀通会话中接⼒棒⼀般服务于客户的不同场景,大模型专属机器⼈也可以在特定的场合发挥能⼒,并逐步替代⼀些以往模式僵化的问答型机器⼈。
而外部知识库需要整合在智能客服产品中,将已整理的知识内容转化为输出产物,更⽅便⽣成知识⽂章、图⽚、甚⾄⾳视频。基于 ChatGPT 的多模态的 AIGC 能⼒,可以快速⽣成⼀个个性化的知识空间。
总的来说,还是利⽤大模型⾃⾝的⽣成能⼒,基于向量数据库、可信内容审核等技术,为智能客服提供优质的内容补充。
尽管大模型在智能客服领域的构建流程和链路已经基本清晰,但在实际落地过程中仍然面临着多种挑战。
据受访专家透露,这些挑战主要来自数据层面,以及和实际客户的系统场景对接层面,产品本身反而是比较容易的。例如,新要上的系统的客户数据本身是原始的数据,需要清理出高质量的结构化的数据才能够有一个比较好的效果,但这一步是十分困难的。
第二个是当实际深入到业务中去的时候,会出现各种信息散落在客户内部的各种系统里的情况,只有把这些信息打通才能有一个好的效果和体验。这些都是未来需要重点攻破的难题。
做 Demo 很容易,但是要深入场景的成本,其实主要不在有一个模型上,其实没法给一个具体的数字。
目前,以 ChatGPT 为代表的大模型已经在许多企业中用于智能客服应用。它可以通过自动回答常见问题、解决简单问题和提供基本支持,减轻人工客服的负担。大语言模型通过深度学习和大量的语言数据训练,能够理解和生成人类语言,使得用户能够以自然的方式与它交互。在一些常见的客户查询和问题解答方面,这类大模型已经取得了相当不错的效果。
然而,当前的大语言模型在实际应用于智能客服场景中时仍存在一些挑战——它可能会生成错误或不准确的回答,尤其是对于复杂的问题或领域特定的知识,这就对智能化程度提出了更高的要求。未来的在线客服系不仅需要更高级的算法和机器学习技术,还需要更多精准的自然语言处理能力。这将对在技术上不太强大的企业形成巨大的压力。
此外,随着用户数量和访客量的增多,未来智能客服将需要处理超大规模的并发请求。这需要系统在多种方面都拥有特殊的设计,如负载均衡、高可扩展性和高可用性等。
现在市面上的很多对话机器人,回答是单一固定的,变化比较少,与真实的人与人对话还有差距,未来的智能客服系统将需要进一步加强对用户行为的自适应性和个性化服务。这就需要系统学习更多的用户数据和信息,并适应不同的用户行为,为他们提供更好的服务和体验。如何提升用户体验就成为了智能客服供应商主攻的方向。
具体来讲,主要应从人性化服务、个性化服务和拟人化的对话交互方面进行改进。
首先是人性化服务。在场景和意图理解精准的基础上,附加更有温度的对话语境,可以让机器人在拟人化上,再进一步。多模态情感计算是实现这一步的有效方法。目前,我们正在推进虚拟数字人客服进行人机交互对话,在此过程中结合情感计算,可识别用户通过视频、语音、文本所传递的情感表达,让智能客服在应对是作出相应情感反馈,打造具有情感理解、有温度的人机交互。这种多模态情感计算技术的实现方法主要是通过基于专家规则和基于机器学习两种。其中,基于机器学习的方法通过训练模型来自动学习情感状态的分类标准,可以更好地适应不同领域、不同语境下的情感表达,效果相对更优些。
其次是拟人化的对话型交互。通过场景化设计优化,比如问题拆解、主题继承、多轮对话、上下文理解等等,机器人能够带来一种更加贴近自然对话场景的对话型交互模式。
第三是个性化服务。根据客户画像千人千面提供个性化服务,从多角度出发进行语义理解,此外还要附加语音情绪判别。
大模型诞生后,无疑为智能客服领域注入了新的“营养剂”。这种“革新”体现在多个方面,包括座席辅助和座席提效、闲聊寒暄、话术优化建议、提供语料扩写等。
座席辅助和座席提效:过去的智能辅助更多局限于按单轮对话来完成,基于大模型的能力能够快速分析并生成面向客户侧的系统支撑策略,这种处理效率和结果,远超出依附纯规则或者纯知识库所能达到的效果;
闲聊寒暄:是智能客服非常关键的基础能力,能够帮助企业对任意进线客户进行即时响应。过去的智能客服闲聊主要是将各类非业务相关的语料堆到素材库,并通过调取数据库已有的关键词进行内容的回复。如今可以充分借助大模型能力提供闲聊,在非业务领域上为座席和客服提供更多决策依据和参考;
话术优化建议:话术往往决定了客服的效果,话术回复不精准将直接导致用户的流失。通过大模型强大的内容生成能力,智能客服能够对话术进行不断地迭代和与优化,提升客户满意度;
提供语料扩写:在智能客服冷启动阶段,往往需要足够多的语料来丰富知识库的相似问法,以保证上线初期智能客服有足够高的解决率和场景覆盖率。以往的语料生成模型很难覆盖众多垂直行业和领域,大模型在通用领域中积累了足够的数据和语料,可以很好的弥补语料生成模型的不足,快速生成相似问法,解决智能客服冷启动语料不足,场景覆盖率低等问题。
归根结底,提高对话质量的核心还是理解客户和用户的场景,以及能够搭建出衡量得失的数据框架。这两个组合之下,会有一个循环反馈的过程,就能够通过正常的产品迭代达到好的效果,并且能够衡量出来 ROI 和对实际业务的共享。
随着全社会点数智化进程步入深水区,越来越多的企业开始使用数字化工具——智能客服系统来做好客户服务,打造极致体验,进而提升企业核心竞争力。
无论是垂直领域还是通用型职能客服厂商,都希望凭借 AIGC 技术的成熟让企业更上一个台阶。但要想把梦境变为现实,仍然任重⽽道远。⽐如需要衡量成本与收益之间的投⼊产出⽐、需要保证⽤户的数据隐私安全并遵守相关的法律法规、需要保证产品在不同⾏业场景的通⽤性及灵活度。
就客服行业而言,传统人工客服向智能客服升级是必然趋势,但在可预见的未来内,智能客服还无法完全替代人工客服。它们分别有不同的特点和定位,在处理复杂问题以及对高潜客户跟进的服务场景中,人工客服仍然处于不可或缺的地位。因此,企业需要根据自身实际情况,综合考虑人工客服和智能客服的优势,从而制定最佳的客户服务策略。
整体来看,AIGC 未来有较广阔的发展空间,未来两三年 AIGC 和类 ChatGPT 产业将高速发展,带来互联网和企服产业的进一步升级和变化。
不过目前在内容质量、投入成本、数据安全、隐私规范、版权归属等方面仍存诸多问题。另外,在长文本生成、视频生成、融入世界知识等方面,还需更好的建模方法;通过加大模型参数增强 AI 能力,其训练和推理成本高昂,需要探索更经济、有效的性能改进途径。
采访嘉宾 :
贾皓文,华院计算技术总监兼数字人事业部联合负责人,原阿里巴巴集团架构师,也是一位连续创业者。
王素文,中关村科金智能交互研发总监、中关村科金智能客服技术团队负责人。