Whale 帷幄创始人叶生晅:我刚去硅谷转了一圈,发现了AI创业的四大方向

Whale 帷幄是一家专注于AI技术且估值超10亿美元的独角兽公司。在混沌“一”思维创新嘉年华活动现场,Whale帷幄创始人兼CEO叶生晅基于AGI底层逻辑,探讨了如何借助AI技术为品牌营销赋能,推动营收增长,优化客户体验的经验。面对人类与AI的交锋,他说:“AI最终不是替代人的,AI只是一个辅助工具,它和人之间是和谐共存的关系,仍然需要人类的思想来帮助人类与AI共同进步。”对于AGI真正落地到垂直领域,他认为需要花5至10年的时间。目前真正能够商用的只有文字模型,在半年到1年的时间里,可商用的图片生成模型会产生;未来1到2年之内会产生视频生成的应用;未来3年或者更长的时间里,模型将逐渐会在各个领域里面使用。如何将AGI结合垂直性应用,在内容管理上应该做足哪些准备?如何用数字化+AI开创营销新打法?

混沌在上海滴水湖洲际酒店举办“一”思维创新嘉年华活动。用一整座岛、打造两天两夜的共学场,2000位混沌同学热烈参与其中!邀请AI 全明星阵容空降授课。此次,叶生晅做客混沌“一”思维创新嘉年华带来的分享是《品牌提效: AIGC如何打造全渠道全流程的营销体系》。本文为混沌“一”思维创新嘉年华大课笔记第四篇。

授课老师|叶生晅 Whale帷幄创始人兼CEO编辑丨混沌商业研究团队支持丨混沌前沿课

帷幄的两大关键词

帷幄从2017年12月创立,5年的发展主要依赖两个关键词:一是技术,二是品牌。在过去5年,我们已经服务了约1000家大型品牌,例如餐饮、时尚企业服务、数码电器、地产行业等,其中汽车行业是我们重度参与的行业,中国的上百家车企里的大部分品牌都和帷幄有合作。

由于我们是一家技术公司,基本上70%左右的研发费用会用于推进人工智能、物联网和数据技术,以及它们在消费者营销和销售领域的应用。在AI方面,最开始的时候我们从线下开始做,从底层的边缘的视频监控看线下的客流、店内的热力,知道店内每个人的行为,后来才开始做一些音视频的内容分析。在销售领域,线下主要是用语音工牌来判断销售和营销人员对客户所说的内容是否合规,线上是在直播间做直播质检,帮助直播人员更好地卖出东西。

AI如何重新赋能人、货、场?

对于消费品牌来说,技术赋能将建立起显著的竞争优势,而数字化的关键吸引力仍然是围绕着人-货-场。这幅图是从某知名咖啡品牌去年的财报上抽出来的,他们认为数字化仍然是其为什么能够成为“唯一”的原因。我们从营销的角度来分解人-货-场的关系就是人、内容和场。

第一是用户。用户的关键词是用户参与,拆解后是怎样持续获取新的客户和留存客户。底层的技术平台是CDP,把各种各样定义人的标签存在一个系统里,例如,茶饮品牌会用2000多个标签去看各种人,有一些会比较有意思,比如“小镇青年”标签、“老铁666”标签。

第二是场。场的关键词是门店,拆解后是如何实现门店标准化服务与运营。底层技术平台的SDP,即场域标准化,比如去任何一个星巴克的门店,进去以后每个人做的事情、观感到最后出咖啡,拿走咖啡或者坐在门店里,体验几乎完全是一致的。

第三是货或者内容。为什么把货和内容放在一起呢?因为现在我们去买东西一般是先消费内容再消费货,比如,我们先看了抖音的视频以后,才会买这个东西。对于货和内容来说是一个承接的关系。从货或者内容来看,整个流程从生产到分发,越有效越好。AGI能够赋能营销和销售科技,即如何把内容生产到内容分发变得更加高效。

货的底层技术平台是DAM。从CDP、SDP和DAM组成的数字化体系中可以实现商业化洞察和自动化经营。比如BI报表,就是一种可视化分析,属于商业化洞察一类;后厨里,店员有没有洗手,与明厨亮灶相关的则与自动化运营相关,使得整个巡检的系统变得更加自动化。

从人的角度或者顾客的角度来看,所有的营销和销售唯一要做的事情就是在整个客户旅程里,将客户旅程定义出来之后,提升转化率。比如某咖啡品牌在抖音的直播间发了优惠券,用户到达门店以后体验很好,购买了咖啡,最后去小红书发了一张图片。这是一个用户旅程,借助用户的每一个步骤看它的转化率是多少,接着根据各种方式去增加转化率,先收集数据再提升转化率。

对于汽车品牌来说也是一样。有很多汽车品牌现在都是从线上开始,在抖音里能刷到很多主播在卖车,后台会要求你把电话号留下来,然后给你打电话约你线下试车,试车后发送试车报告,邀请用户添加二维码,变成私域流量,最后形成转化。

为什么线上特别重要?因为在国内有20%、30%的流量来自线上,特别是在抖音平台。比如喜姐炸串,从线上卖优惠券,在抖音上卖了1亿,同时在线下做转化,转化成私域流量。

在整个流程里,AI和AGI能做非常多的事情,我们总结了J型的全渠道流程:所以很多的营销范式是从直播去做引流,随后线下体验,变成私域流量,完成转化和留存。这是非常典型的营销场景。

帷幄为了以上三个场景做了三个产品:Web 0是线下门店的数字化运营,Web 1是私域运营体系里的内容管理、内容营销从生产到分发的整个流程,Web2是针对直播间的数字化体系。我们会基于AGI的数据分析云和开放云,帮助消费品牌的数据科学团队以及 IT 团队更好地应用底层 AI、IoT和数据能力,在整个营销中看客户的旅程以及转化链路。

从营销运营大体系寻找AI机会

我从去年12月开始系统性看整个大模型,今年3月去硅谷转了一圈,同业内大佬们交流探讨,从投资的角度总结来看,生成式模型有四个投资方向:

最底层是大模型,可以是语言模型,也可以是图片和视频模型。这里不仅需要金钱和算力的投入,尤其注重数据的积累,比如Open AI在过去的5年时间里积累了大量由人工标注的数据,这也是为什么现在国内要用一定的时间来追的原因。所以,大模型这一块是很难的事情。

往上是平台层,让语言模型或者各种各样的大模型跟现实已有的GUI或者API做对接。比如说我要买一张机票,我现在在上海,我对大语言模型说我要买一张去北京的机票,在系统背后会也非常多的流程要去做。要通过手机的GPS来指导,喜欢早上的飞机也是由于以前的偏好决定的,所以这些东西会存在数据库里面,或者是去扩展一些以前已有的API,拿到了这些数据以后,最后依靠订机票的系统,把订机票这件事完成。其实在底层有很多的机会,无论是建造引擎,建造图数据库也好,有很多平台层的机会。

平台层之上是可控性和个性化。可控性决定了生成效果。比如用Midjourney等工具,是为了更好地控制。假设我要生成一辆车,车是不能变的,背景能变,我需要控制这辆车。可控性和个性化带来了大量垂直领域的应用,因为这些事情需要专业领域的人来做,对于专业知识的需求是很高的。比如在HR领域里,HR需要判断简历合适还是不合适,这些个性化或者可控性的模型需要有非常多的知识,才能够把这些东西做出来,所以我认为在这一领域会产生很多机会。

最后是应用层。我认为最大的两个应用是营销和游戏。营销是为了提升转化率,帮你赚钱;游戏是从原来的封闭域变成一个开放域,提升用户体验。剩下的很多应用都是以效率工具为主,如HR如何把简历直接打分,如何帮医生写病历,如何让大家的生活更便捷……总的来说,我们认为应用层的机会有三大类:营销、游戏和其他。

做大模型需要什么?

大模型需要怎样的投入和投资,由难到易排下来,这是我们在投资的时候或者落地大模型的时候发现的一些难点。

首先是数据。一个好的模型真正能够用起来基本上是靠数据的,哪怕用不到GPT-4这个水平,哪怕是GPT-4的1/10大小的模型,如果是好的数据,在某些方面依然能够超越GPT-4。所以我认为高质量的数据是一个好的大模型最重要的前提条件。

OpenAI能做出GPT-4的原因是它在前面花费了5年时间标注数据,而且标注的数据是高薪聘请真正当老师的人跟GPT对话产生的,这些标注是非常高质量的,因此你会发现GPT-4说出来的话特别像老师,它有一种说教感。对于中国的大模型而言,没有好的语料以及好的标注是最大的难题,这需要时间。而且,由于中文比英文更难一些,有很多的歧义,对于模型来说,这些是很难学习的部分,需要很多的语料来学习。除此之外,各大平台上低质量的营销类文案太多,缺乏高质量的文字,所以优质数据的获取是最难的。

第二是计算资源。由于美国禁止了芯片,如果现在要训练一个大模型,缺芯是很严重的问题。真正训练过大模型的人知道,现在能用的显卡是A100,在内存和显存的使用效率上差距太大,这是比较难拿到的资源。

第三是人才。3月的时候,中国企业去硅谷蹲在OpenAI的门口招揽人才,今天已经没有了。这是因为硅谷的人才流动是很快的,OpenAI的人过了半年说不定就去了谷歌和Facebook,他们倡导的是知识的快速平衡。你怎么去训练模型这件事。在3个月到半年的时间内,你可以看到大量公开的模型慢慢在超越GPT4,我觉得知识这件事没有那么难。

训练模型是一个魔法师的工作。模型训练得好的人在看到曲线以后,看了一眼就知道这个东西是否正确,如果不对就立刻停掉,因为多一分钟,它的计算成本就会大很多。一个好的训练人才,在训练模型的几分钟内就知道这个训练是否会成功,然后重新调参数。训练一个大模型和训练一个推荐系统的模型是差不多的,所以,人才在模型训练的工作上十分重要。

第四是模型本身。在3个月前没有那么多开源的东西,现在有很多开源的模型。如果一个初创公司去搞一个模型,可以直接在网上找到,并没有那么难,难点在于如何将数据、计算资源、人才和模型依次排序。

数字化在真正的领域里面已经经历了10年左右的时间,落地仍然需要很长一段时间。有些人会因为担心赶不上AI大时代而焦虑,其实没有必要,我认为真正把AI落地或者AGI落地到垂直领域里要花5到10年的时间。生成式AI是一个工程时间问题,现在我们真正能够商用的只有文字模型,在半年到1年的时间里,可商用的图片生成的模型会产生;未来1到2年之内会产生视频生成的应用;未来3年或者更长的时间里,模型逐渐会在各个领域里面使用。

离客户越近,越能享受技术红利

回看历史,对比Intel和微软,Intel之所以没有微软活得好,是因为微软利用了摩尔定律,真正造出了一个应用层的公司。事实上,90%以上的红利都是被应用层吃掉的。如果应用层有垂直领域的可行性,我认为还是非常有机会的。

深入到AGI的基础架构,对于每一个公司来说要选择两种方式,一种方式是调用大模型,比如GPT-3、GPT-4,或者国内的文心一言,然后去做一些可控、垂直的大模型。另一种方式是训练一个企业专有模型,不需要把数据丢到外面。无论是从数据的隐私角度来说、还是从运营成本的角度来说,都会有利得多。

对于这些模型来说,我觉得唯一需要解决的问题是拥有很好的逻辑能力。逻辑能力是一个涌现的能力,我们拿到大模型逻辑能力的涌现是GPT-4带来的,相较于GPT-3.5,GPT-4有良好的逻辑能力,而且不产生错误的答案。用到逻辑能力的时候,一定要依赖一个大模型。类似于企业营销文案工作的文字撰写是不需要逻辑的,这种类型可以用企业的专用模型。但如果是订一张机票,需要一些逻辑能力,可以用大模型来做。这是一个非常简单的判断标准。

模型的底层通用引擎和向量数据库,它靠的是API或者已有数据库的记忆。把以前的企业知识图谱相关的知识抽取出来,便需要用到。对于每一个领域来说,需要做有逻辑的还是没有逻辑的,意味着把左边那条路做通,或者把右边那条路做通。

Agent是把所有的模型分成很多个小模型,将一个任务拆解成很多小的工作,每一个的工作可以有一个Agent,或者一个专用模型来做,用来做简单的事情。很多人会追问大模型是不是需要一个通用大模型,或者需要一个倍量级的模型,其实大部分落地的场景里面是不需要的,而且小模型效率会高很多,因为更多的模型带来的是一个指数级的服务成本的提升。

AGI的技术分成三个部分,第一部分是私有化企业级的LLM模型,第二部分是图像模型,第三部分是图引擎。Alivia是帷幄发布的一个企业级AI工具,事实上我们已经把整个AGI工具集穷举下来了。Copilot做的是文字生成,Xbox做的是图像生成。对于每一个企业来说,都需要有一个模型的管理中心,为产品服务,尤其是需要私有化的模型部署,因为每一个企业做的事情是不一样的。比如车企是需要对车文字的描述,这些描述是需要有特定的风格。对于我来说,我有时候会用微信文案写作模型,帮助我在发一条简短的朋友圈文案。

我们提供了Alivia的图片编辑器,叫做Alivia Paint。比如要生产一个戒指,戒指的材质以及纹路可以训练出一些Laura模型,用这些模型控制戒指的生成,最后让生产商去生产。除了Alivia paint,我们还提供了视频编辑器,用于视频生成,并提供了企业模型管理中心和企业模型训练中心两个系统。

Marketing+AGI如何使品牌营销降本增效?

我们知道,marketing或sales关注的是GMV,即内容宽度×转化深度。内容宽度是有多少的内容可以呈现给消费者,转化深度是每张图片用户看到了以后能够实现多少转化。人们都是先消费内容再消费产品,所以更加往内容的角度发展,而AGI正好把营销这件事情从内容的角度支撑起来。它可以根据不同的用户标签,生产出无限多的图片,从而有效提高转化率与最后购买的可能性。

Marketing AGI颠覆了电商行业,不仅效果逼真,而且成本极低。下面我将列举AGI在营销方面的应用:

例如汽车行业,我们做了一个Cast 产品,在征得用户同意了以后,会把销售说的话和客户说的话记录下来,用AI转成CDP的数据。如果用户喜欢野营,在试驾报告里面会把车放在一个绿色的草地上,由此试驾报告的点击率会增加30%到40%,每一步的转化率提升代表了最后成交可能性的提升。

例如时尚行业,用火柴人的图片生成模特的图片,根据火柴的摆放形状来表现他的姿势。

例如珠宝行业,只要一直点AI,就能生产出很多符合自己喜好的商品,然后去工厂生产,或者投流出去变成爆品再生产出来。

例如数字人和短视频生成应用,在文字生成上,通过训练数字人大量已经说过的内容,生产出符合提升销售效率的话语。

说了这么多AI在应用层的例子之后,我想最后提醒,基础的工作仍然是把内容管理这件事情做好,即内容侧的管理、搭建标签体系、内容质量打分并通过数据反哺AI等内容,这些才是AI的数据基础。

第一,在系统做审核等管理工作,判断内容是否符合公司要求,是否违反广告法。

第二,搭建标签体系,比如“老铁666”,“小镇青年”,将人和内容对应,并标签化,观察内容是否被特定标签所喜欢。

第三,给内容质量打分,收集了大量数据以后,通过这些数据反哺,变成一个很好的训练集,给内容本身去打分,判断哪些内容投出去以后会成为爆款。

在做AGI或者做AI的体系下面,对内容的管理体系非常重要。从在线的协作内容生产、企业级的内容资产管理到内容分发、洞察整个体系,帮助大家先把内容给沉淀起来,再把整体的AGI用于营销和销售体系,是将技术真正落到实处的重要举措。哪些技术能用,哪些技术不能用,在营销界如何把这个技术真正落地,真正成为能够高效增加转化率提升的重要工具,帷幄做了一个先行者。

Q&A

张晓楠:如果企业都开始用AI做内容,底层的模型是共通的,是否会导致营销内容泛滥,产生同质化现象,如何确保每家企业用AI做营销的时候,生产出真正个性化的内容?

叶生晅:这不仅仅是AI现在的问题,我觉得也存在于营销界。比如一个产品为了投流,可以投几千条内容,把小的短片通过混减形成一个新的video,非常同质化。基于这个问题,我们会从平台侧去鼓励展现真实生活。

张晓楠:平台侧一定会管的,像大家看了一年级的暑假最可怕,二年级的暑假最可怕,三年级的暑假最可怕,一路说到了初三的暑假最可怕,这也是大家同质化的内容,批量生产的结果。

叶生晅:其实存在了两个AI的对抗,即平台侧会有一个AI帮助你识别一些自动生成的内容,生产侧也会有AI,这是让整个体系共同进步的一种方式。AI最终不是替代人的,一定和人做共存的。人要生产出高质量的想法,爆款的东西都是有人的想法在里面的,AI最终是一个辅助工具。我觉得AI和人之间是一个和谐共存的关系,它永远替代不了人的,仍然需要人类的思想来帮助我们共同进步。

常见问题

AI在营销领域有哪些投资方向?

生成式模型有四个投资方向:最底层是大模型,需要大量数据和算力投入;往上是平台层,让大模型与现实GUI或API对接;平台层之上是可控性和个性化,带来大量垂直领域应用;最后是应用层,最大的两个应用是营销和游戏,营销是为了提升转化率,游戏是从封闭域变开放域提升体验。

AGI技术落地到垂直领域需要多长时间?

真正把AI落地或者AGI落地到垂直领域里要花5到10年的时间。生成式AI是一个工程时间问题,现在真正能够商用的只有文字模型,在半年到1年的时间里可商用的图片生成模型会产生;未来1到2年之内会产生视频生成的应用;未来3年或更长时间里模型将逐渐在各个领域使用。

大模型成功的关键因素有哪些?

大模型成功需要四个关键因素:高质量数据是最重要的前提条件;计算资源特别是芯片资源;训练模型的人才,需要能快速判断训练效果;模型本身,现在有很多开源模型可用。难点排序依次是数据、计算资源、人才和模型。

AI如何赋能营销中的人货场关系?

AI通过三个技术平台赋能人货场:CDP用于用户标签管理,SDP实现门店标准化服务,DAM管理内容从生产到分发。AGI能够把内容生产到内容分发变得更加高效,在客户旅程中提升转化率,特别是在直播引流、线下体验、私域转化的典型营销场景中发挥作用。

企业如何选择AI模型部署方式?

企业有两种选择:调用大模型如GPT-4,或训练企业专有模型。判断标准是是否需要逻辑能力——需要逻辑能力的用大模型,如订机票;不需要逻辑的用企业专用模型,如营销文案撰写。企业专有模型从数据隐私和运营成本角度更有利。

如何避免AI营销内容同质化问题?

平台侧会通过AI识别自动生成内容进行管理,鼓励展现真实生活。同时生产侧也会有AI对抗机制。AI最终是辅助工具,不是替代人,爆款内容都需要人的想法在里面,AI与人和谐共存,需要人类思想帮助共同进步。

帷幄的AI产品如何帮助企业营销?

帷幄提供三个核心产品:Web0是线下门店数字化运营,Web1是私域运营内容管理,Web2是直播间数字化体系。基于AGI的数据分析云和开放云,帮助消费品牌应用AI能力,在客户旅程中提升转化链路,特别是在汽车、时尚、珠宝等行业有具体应用案例。