Convertlab CEO 高鹏 | MarTech的挑战与大模型的机遇——从生成式AI到合成式AI

Convertlab2023-07-25 11:20

在过去的 8 年里,Convertlab 主要的客户是落地在消费类行业(包括各种业态的零售),围绕消费,我们建立了一个全链路运营 MarTech 产品体系,这是不经过长期打磨是不能全部搭建出来的。

我们从 2018 年开始意识到,按照生命周期对链路进行简单梳理,确实有效。在经历了一年的建设期之后,2019 年我们开始了最早的运营。

在这 4-5 年时间里,无论是目标长远地稳扎稳打,还是急功近利地想快速见效,我们在制定不同策略、付出不同代价的同时,也验证着数据的应用,对业务增长的各种各样的价值(如下图所示)。

我们也有一起经历,彼此陪伴了 5 年的某大型品牌客户,在这些时间里,营销云产品就像是一个心脏起搏器,开或关必会关系到销量的高低。然而,越是高奢品牌,客户体验越会被在意,从客户服务角度切入得更多,我们才有可能获得更多的 VIP 关注。

01 增长背后、运营之中,「服务体感」较「产品」的需求更强烈、更复杂

虽然技术基础设施很复杂,但是相比服务,它的体感没有那么明显。想让服务体系产生效果,背后需要搭建出一个非常复杂的能力体系。

我们频繁在地说“以客户为中心”的能力框架((如下图所示),它表明“以客户为中心”的数字化转型极其复杂,需要综合大量不同的能力,同时需要持续的效果来推动转型的过程。

从这个层面看,消费行业内可能在一定程度上并没有达成共识,还有一些牵涉方面较多的汽车企业,共识是否达成会直接影响到业务延展的广度和深度。比如最简单的线索管理问题,从媒体端到用户运营端,再到门店端可以做到什么程度,在共识达成和没有达成时,做起来肯定是不同的。

我们可以看到的是,即便是在数字化超前其他行业很多的消费领域。因着电商的倒逼,抑或是多年的实践,它在能力层面依然需要依赖一个非常庞大和复杂的外部运营团队。相比技术带来的复杂性和差异化,最后对效果更有确定性强烈体感和产生直接影响的,反而更多的是运营服务。

02 LLM(大模型)能力爆发前后 运营复杂性问题如何解决

运营服务是很复杂的,它非常个性化且很难扩张。对于企业来讲,运营也是试错成本很高的一个长期的过程。

在这种情况下,我们认为大模型还没出来之前的深度学习,应该都叫动物智能,即 Animal Intelligence,其实就是一个简单的网络模型。

我们并没有看到在这个领域里,它对用户运营/企业应用有太大的意义。虽然数据智能在那段时间还是能够起到一些作用,但如果商品的品类比较单一,消费者的购买行为比较趋同的话,可能要花很长的时间,模型的效果才有可能超过经验法则。

所以在大模型真的出现之前,我们当时采取的路线基本上就是,在原本的数据平台和应用层之上,叠加一个由知识图谱驱动的知识层(如下图所示)。

国内传统 ERP 有一个概念叫最佳实践(Best Practice),我们在做了这么多年之后,也总结了不同行业内的最佳实践。然后我们会思考,这些最佳实践能不能迅速地套用到企业里面去,至少能达到 60 分及格水平,这成为了我们当时的努力方向。

我们原本要在今年底发布一个相对自动化的运营体系(如下图所示)。它在原本的规划里出现了一个新的层次,叫做智能运营层,是建立在知识库基础之上的一个智能运营层。但是因为在以前做过一次知识图谱,且不太想做第二次,当时我们的信心并不太足。

但大模型出来后,我们一下子就意识到要变天了。据我们当时的评估和统计,比如说简单如消费类企业的数据清洗,在实施落地期间,脏数据导致的人力投入大概要占项目周期整体能力的 40%。更麻烦的是,哪怕到运营期间,这部分的人力开销还在持续(依据业务复杂程度/数据干净程度会有不同)。

如果做着数据湖项目,企业还上了 CDP,且 MA 也同时在跑的话,把太多的数据放在一起,这个问题的复杂度更高。

所以,当时我们在用原本的方式讨论用知识图谱来解决数据清洗的自动化问题时,技术团队也是半信半疑。但是,当我们拿到 OpenAI 的 Azure 正式账号后,研发团队的同事就迅速做了一个 POC,就是直接把我们 CDP 的业务描述层(之前为自动化做的大量的订单/门店/客户行为/媒体投放等数据建成的标准模型)放到不同行业进行套用,只需要根据不同行业进行微调就可以。

这就是我们说的大模型应用“下沉”到数据层。我们可以直接把一个数仓模型扔到大模型里面,甚至都没有做培训,只是通过简单的指令工程 Prompt Engineering,没有做任何处理和控制,它就直接可以理解我们的自然语言提出的业务查询的需求(如下图所示)。

比如,之前一个研发组需要花半天时间才能查到的过去 7 天的复购率是多少,过去 90 天内卖的最好的 10 件商品是哪些,购买这 10 个商品最多的客户都是谁,而现在,答案马上就会出现。

这个微创新功能打消了当初深表怀疑同事们的顾虑,它使数据清洗这个工作有机会变得有质量。而数据清理只是第一步,接下来的问题是怎样制作报表,怎样洞察报表内的事实,怎样回答一个额外的问题,怎样产生一个妥当的策略,再去执行,执行后怎样衡量,怎样优化……这一系列过程都有机会开始做自动化。

03 大模型的价值不仅在于「生成式 AI」更在于「合成式 AI」

大模型的价值不仅在于生成式 AI(信息的生成),更在于合成式 AI(洞察到执行的自动化)(如下图所示)。所谓的合成式 AI,指的其实是在企业现有的大量的信息基础上,让大模型迅速地跟企业需求和目标对齐(可靠且安全),并自动执行。

当以「合成式 AI」为目标应用大模型时,大模型对齐企业需求变得尤为重要。通过优化和控制,使包含世界知识的大模型对企业的业务目标变得有效和安全,以支撑企业智能运营的各种应用(如下图所示)。

在对齐的基础之上,整个用户运营体系里面会出现一大群新的应用场景,这些应用场景包含了从处理数据、处理什么数据,到数据洞察,再到策略形成至执行的各种事情。它的基础是首先要有一个 Foudation 的模块,来解决安全可靠的问题。

基于一些我们调研的企业的实际情况,我们认为,在目前阶段应用大模型时,以下的三种形式中,会以 Copilot 模式为主。

Embedded 模式会非常多地体现在微创新上,比如让它写个文案,告诉它“想用新颖一点的语言写个招聘广告”,那它就会做生成,它并不改变原有流程,它会提供一些自动化的能力功能。

Copilot 模式,它是在保持原来任务流顺序的情况下,搭建一些透明的捷径出来,一下子执行掉全部的任务流,我们可以在中间的任何一步去干预它,或终止或让它继续跑完都可以。

Agent 模式基本上就是放手让它去干。但今天的大模型相对不靠谱,在业务上面,它对齐的这些工作首先需要数据费用。我们现在搭建 AI Foudation 系统本身的目的,其实是想通过项目调度,在不可能实现的区域,在没有足够语料的情况下,尽可能地跟业务能够匹配起来。

下一步真正可以让大语言模型变得更有效的前提,一定是通过大量的在实践过程中形成的语料,对它进行充分地处理,才有可能真的完成充分对齐工作。

04 研究三件事,共创新能力,大模型会带给我们什么价值

完全的自动化现在并不能做到,但是我们可以极大地降低成本,以大模型为基础搭建全新计算平台为企业提供全新能力。我们目前基本上正在研究并做三件事,它们代表了我们现在看到的一些主要场景(如下图所示)。

首先是客户体验和交互,这些能力门槛很低,但怎样才能把现有数据和流程结合起来运用,比如对三天没到店和刚到店的客户,是否能说出不一样的话,这个很有价值。第二就是前面反复说到的业务的自动化。

第三个是我们看到了新的机会,就是深度洞察客户和趋势预测。比如之前通过调研公司或者是社交调查工具都会做的监听,这个能力在未来可能会发生翻天覆地的变化。

极有可能的是,我们可以用更加结合公司业务的这种语言,来描述市场上的流行的统计,甚至如果我们把它叫做趋势预测的话,我们大体上可以直接尝试去预测一下流行的下回趋势,而且可以直接在这些对趋势的洞察(客户/市场/产品各层面)上,有一些业务语言层面的判断之后,反过来利用一些今天的大模型里的基础设施,深刻认识了 CDP 内的数据,用生成的某种方式来直接进行一部分产品辅助设计。

我们可以看到,在这个领域内有很大的创新空间。

根据陆奇最近在硅谷演讲的「科技趋势图」(如下图所示),我们有几个基本的判断:

  • 大模型是基础设施,耗资巨大,开源和开源小模型也在迅速跟上,不排除涉及合规和管制;
  • 大模型之上的应用,「合成式 AI」对于企业具备更深刻的意义;
  • 关键在于大模型能为我们提供怎样的新能力,同时我们用大模型来解决哪些问题。

关于思考大模型能提供何种不一样的能力,这就像思考当我们拥有了无限量供应的 211 大学生时,我们的业务能力和业务模式会发生何种变化一样,这才是大模型真正能体现价值的地方。

我们也不要奢望他们是博士生或者研究生,我们可以以超低成本就获得他们,只要稍微调整,他们一定能够做好本科生可以做的事情。

当今天绝大部分的企业还在挣扎于一个叫做数据驱动的运营过程(如上图所示),就是是否要把闭环体系、数据底座和运营的基本工具等都建立起来,有的甚至还挣扎于其中的运营基本过程的时候,本身体验的数字化,比如营销运营的渠道和媒体特征等等,还有体验的不断丰富,这些对于企业增长也同样重要。


观点整理:Convertlab 资深研究员/品牌&内容负责人 李勇、孙俊芳
来源:Convertlab CEO 联合创始人 高鹏
排版:Amy

数智赋能每一个岗位