文|刘以秦
编辑|谢丽容
自8月31日文心一言宣布全面开放之后,百度公司(9888.HK/BIDU.O)在大模型应用上打了一个漂亮的开头炮。数据显示,文心一言开放首日,对话频次就超过3342万次,文心一言App登录各大应用商店榜首。
文心一言一役的成功,让聚光灯再次聚焦到百度和其创始人李彦宏身上。近期,《时代》首次评选全球百大AI人物,李彦宏和马斯克、黄仁勋、萨姆·奥特曼等一同被评为全球AI领袖,不仅仅是对他长期以来在人工智能领域的贡献和影响力的认可,同时也代表了中国人工智能领域的实力与在国际上的影响力。
但和用户对话的文心一言App,从战略全局来看,只是百度在大模型应用层大棋盘中的第一手棋。李彦宏在早些时候的公开讲话中重点提到,百度所有的应用都值得用大模型重构一遍,这个定调有一个关键词——“重构”,而非“升级”。
9月13日,百度发布文心一言插件平台“灵境矩阵”。这是百度在大模型应用层面的一次重要动作。
当日,百度集团资深副总裁、百度移动生态事业群组总经理何俊杰在接受媒体采访对中国大模型竞争做了一个阶段性判断。他认为,基础大模型的竞争结果已趋于明显,接下来将从“烧钱做大模型”进入“应用层之战”。
灵境矩阵,简单来说,是百度对外输出大模型能力的平台,开发者可以通过该平台低成本地使用文心大模型的能力,不需要自己从头开始搭建大模型。对于百度来说,文心大模型相当于大脑,灵境则是大模型的手和脚,让大模型能够触及到更多场景,从而不断提升相应的能力。
百度已经在一些应用上进行“重构”,最典型的是百度文库。
何俊杰表示,原有的功能就是搜索和下载,用户停留时长非常短。大模型“重构”文库后,现在变成了一个一站式智能文档平台,用户通过文库生成创意、编辑内容、管理,能实现做PPT、文档、图片、内容分析等功能。链路变长后,用户留存率和付费率都有明显增长。
百度文库之外,百度搜索、百度输入法、百家号、百度地图等产品都在用大模型能力“重构”。百度移动生态内部正在进行一场“赛马”运动,让用户投票,哪个产品用户量大、留存长,百度就加大“重构”的投入力度。
没有人愿意失去这个机会。但用大模型去重构一个成熟的应用,既简单也不简单。不仅百度,目前还没能出现一个大模型时代的超级应用,也很难预测会是什么样的超级应用。何俊杰认为,大模型时代会有新的类似打车、外卖、短视频应用,一旦出现就是大模型发展的拐点。百度在尽可能的尝试和试错,不局限于C端和B端、自研和开放。
今年年初至今,大模型从爆发到应用,仅用了几个月的时间。大模型的优化依赖于更多高质量的数据和场景,这意味着只有越来越多的人用起来,才能让大模型越来越好用。多位科技行业人士表示,技术之争和应用之争是两条不同的路径,用户会选择“好用”的应用,而非“技术很强”的应用。技术能力一直是百度的优势,但要在大模型应用层建立绝对优势,则是对百度的一个新考验。
今年3月16日,文心一言开放内测,8月底上线各大应用商店向所有人开放。多位百度人士表示,大模型是目前百度最看重的事情,为了尽快在最短时间内升级大模型“智商”,内部的重要资源都扑在这件事情上。
技术范畴内的事情,进行的相对顺利。大模型的算力、数据、模型算法层面,百度此前就有深厚积累,可谓按部就班。
算力层面,早在2021年6月,百度就在规划高性能GPU集群建设,且还在不断扩充算力能力。
数据层面,除了过去的自然语言数据的积累,百度还于今年4月在海口落地了大模型数据标注基地,专门用于大模型标注。
模型层面,百度一直在做模型迭代,文心一言刚发布时是1.0版本,到今天文心一言已经是3.5版本,预计今年年底会更新至4.0版本。
应用的重构则需要一步步探索。百度各业务条线在大模型重构应用方面的探索,最早在今年2月启动。
何俊杰将文心一言App定位为“人人可用的AI助手”,但所有人都清楚明白,大模型应用不能只停留在“对话”上。一个好的应用是要能满足用户的诉求,而诉求与场景密切关联。例如,百度有搜索功能,但用户想购物时,可能会去电商平台或是内容平台搜索相关信息;用户想看娱乐八卦时,可能会去微博上搜。
大模型的基础功能是内容生成,非常符合办公、学习场景的诉求。百度副总裁、互娱和垂类平台负责人王颖介绍,事实上,从今年2月开始,她的团队就开始思考文库能怎么和大模型结合,3月,部分功能甚至已经开始测试。
想满足用户诉求就要先了解用户。王颖发现,当用户想写一篇文章或是做一个PPT时,会先打开网站搜索资料,阅读资料就要花很长时间,选出可用的素材放到文档中,还要编辑修改,这个过程会反复多次。最后还要调整格式,会涉及到不同类型的文档要切换不同的软件,许多用户其实并不能熟练掌握每个办公软件,来精细调整格式。
这些都是用户痛点,而大模型刚好能解决这些问题。用户只需要简单的口令,即可快速生成相关的内容文档。
发现了用户诉求,还需要有技术能力支持,这是一个相辅相成的过程。以生成PPT为例,看似很简单,实际的技术细节很复杂。实际场景中,用户通常会有两种需求,一是用户给主题,大模型生成PPT;二是用户给素材,例如给一份Word文档,要求大模型转成PPT。”王颖说。
但如果要求基于文档生成PPT的用户是有明确预期的,既要遵从内容,还要超出原有内容,甚至能够发现内容中的漏洞,补充相关信息,修改相关错误,这样的能力就不简单了。如果用户给的文档很长,大模型要先做解析、分段、切片,再理解、合并、优化,而这个还过程必须足够快,不能卡住。
何俊杰提到,文库的重构不仅是产品形态,整个团队都基于业务流程做了重组。原来的检索、存档、存储能力需求下降,对用户个性化需求理解,提示词工程相关的人员数量大幅增加。
一位百度人士表示,目前看来用户对于新版文库的反馈整体还不错。
例如,有一家公司老板要对外交流,需要做一个PPT,除了公司的基本介绍,还有一个部分是“技术会如何改变这个行业”。“类似这样的内容就很适合用文库直接生成。”他在那次交流会上发现,现场没有人发现PPT是大模型做的。
在自身业务上先用上大模型,也是百度对外开放大模型能力的准备。“只有先自己用上了,才能发现应用时会遇到哪些问题。”百度集团副总裁、百度移动生态事业群组搜索平台负责人肖阳提到。
事实上,“把药先用在自己身上”也是大型科技公司对外教育市场的一个通用手段——对于很多企业用户来说,大模型还是一个新物种,很多人并不知道应该怎么用好大模型,百度需要用实际的案例来向用户展示。
大模型是一个创新技术,技术本身并不直接产生价值,落到具体的应用场景中,技术才能创造价值。
对于开发者们来说,做大模型时代的应用会遇到几个现实难题。一是大模型本身很“烧钱”,自己做大模型对于很多公司来说性价比并不高,他们更需要的是低门槛且足够可用的大模型插件;二是流量,不少开发者都提到,无论是现有的应用或是开发一款新应用,都很难快速获得流量;三是商业化,即使有了流量,如何更好的把流量变现,也是难题。
这意味着大模型生态是一个“多边逻辑”,底层是模型能力,再往上是用户需求,而用户需求是在不断变化甚至还未被挖掘的。另外,在这些之上,还有商业化的需求,如果整个生态中没有广告和付费的空间,就难以持续运转。
何俊杰说,灵境矩阵就是重点帮助开发者解决这三大问题。插件是长在文心大模型上的,不需要开发者使用任何百度的其他产品,可以在不同的终端、应用上调用大模型的能力。目前大模型的硬通货是算力,百度灵境矩阵会给首批合作开发者提供算力扶持。同时,也会有流量扶持,并开放百度移动联盟的变现能力。
目前,灵境平台的插件类型包括数据、能力和应用三类。数据是不同类型的数据库,能力是垂直模型能力和多模态能力,应用则是封装好的各类应用。开发者可以根据需求选择多个插件。
例如,中国司法大数据研究院和携程旅行在第一时间就进驻,他们在法律和旅游两个垂直领域发布了示范性的插件。基于这两款插件提供的数据能力,帮助百度的两个行业助手“法律智能助手”和“旅游智能助手”在关键决策场景大幅提升用户的体验。短视频生产平台井英科技通过大模型插件,实现了用AI将小说变成短剧的功能。景区信息化公司鼎游接入了AI导览数字人插件,用户可以通过语音或文字与AI导览系统实时互动,获取景区的各类信息和服务。
大模型现在依然处于“烧钱”阶段,如果用户量越来越大,交互频次越来越高,对于算力的压力会陡增。何俊杰说,他现在完全不担心这个问题,这是“幸福的烦恼”,百度愿意也有耐心在现阶段做大规模投入。
对于百度来说,开放生态更大的价值是能够补充大模型的能力。大模型已经开始从通用大模型进化到垂直大模型,这需要多样化的生态来参与。不同的场景能带来不同的新数据,更多的用户能检验大模型能力,让模型增长更快。
而这些场景百度很难自己做,“百度能做200个应用,但是做不出1万个应用。”何俊杰说。
OpenAI的商业化一直是大模型领域重点关注的方向。今年2月,OpenAI推出付费版ChatGPT Plus,是商业化的第一步。随后OpenAI又在其大股东微软的各类应用中上线了大模型相关能力。今年5月,OpenAI推出插件商店,共有超过80款插件,开发者付费调用。今年8月,OpenAI推出企业版,目前还未透露具体的收费标准。
大模型的应用基于两个方向,一是解决过去很难解决的问题;二是激发出新的需求。
只有解决了问题,才有机会谈商业化路径。百度的一个商业化探索路径是广告行业——大模型的主要能力是内容生成,再加上和用户互动的过程中,能够快速学习,更了解用户。这对于广告行业来说,能有效提升效率。
在广告场景中,“关键词”是搜索引擎广告投放的核心技术。广告主将产品、服务与营销策略拆解为关键词,输入系统,决定符合条件的用户在搜索哪些词句时,能够看到广告。更多的关键词意味着更多的曝光与流量,也意味着更高的运维成本,因此,广告主需要尽可能精准地找到、动态调整关键词来得到精准流量,提高ROI,而这并不容易。搜索营销系统因此添加了更多的功能、更多的层级、越来越复杂,广告主学习和使用成本越来越高。
何俊杰提到,广告行业里一直有一个痛点,就是难以检测投放效果,原因包括广告目标不明确,渠道不够合理,内容不够创新等多种因素。大模型刚好是能解决这一问题的工具。“对话”比搜索关键词更能精准体现用户的需求。其次,大模型可以让广告主快速生成海量内容,来匹配不同用户,还能根据用户反馈实时优化。
百度集团副总裁、移动生态商业体系负责人王凤阳提到,他的团队不断根据客户需求去丰富功能。“(投放系统)繁杂到一定程度,客户记不住操作方式,我们就简化;简化到一定程度,满足不了客户,又开始变繁杂。过去20年,数字广告平台一直在重复这个过程。”
为了解决这些问题,百度营销推出AI营销平台“轻舸”。轻舸以文心大模型为基础,界面左侧是类似于文心一言的对话页,右侧是方案预览区。广告主无需提炼关键词,可以使用自然语言表明投放需求。
例如,“帮我把广告投放给想学IT找工作的年轻人”,轻舸会自动选中人群,并生成相关创意,以此提高投放效率——轻舸内测期间,IT教育集团达内的转化量提升23.3%,广告ROI提升 22.7%;百度服务商品众创新日均转化新增32.4%,成本同比降低20.2%。
除了广告,商业化的另一条路径是C端付费。目前百度文库的发展方向就是基于C端收费,何俊杰也提到,文心一言App未来也会有用户付费的空间,但核心还是在于是否能把握用户的核心需求。
多位业内人士提到,大模型会改变很多应用的商业模式,最典型的就是搜索。传统的搜索场景中,用户搜索关键词会出来很多相关内容,广告也得以展示。大模型时代的搜索,内容会更精准,也会限制广告的出现。一位百度人士提到,“目前还没有明显影响,但未来搜索的商业模式一定会改变。”
肖阳认为,搜索技术和大模型是能结合起来发挥更大价值的,并非“颠覆”。大模型技术能更好地满足用户的搜索需求,搜索价值提升后,商业化的空间会更大。
大模型究竟能解决什么问题,带来怎样的新商业机会,现在还很难看清楚。大模型或许能带来比移动互联网更大的产业浪潮,但在此之前,还需要更多的挖掘和试错。
做好技术系统,探索应用“重构”,找到商业化路径,百度已经大模型时代走上了一条属于自己的道路上。
“不要温和地走进那良夜”。在联盟大会的现场,何俊杰提到《星际穿越》里的这句台词。这代表百度的态度,对于整个大模型时代的创业者来说,或许也是如此——持续往前走,即是进化。