钛媒体特别专题策划《数字思考者50人》:探访中国50位独具代表的数字化思考者。我们理解的“TechThinker” ,涵盖了中国数字化浪潮中的技术践行者、政策制定者与投资决策者。在这场长达10年的乘风破浪中,我们每个人都在分享技术进步的果实,却鲜有人知道结果背后的故事。我们期待通过《50人》,还原中国数字化推进过程中的关键决策,同时也为你呈现数字思考者们的管理与经营之道。
中国的云市场正值酣战,但广大的市场空间和快速的技术迭代,依然给后来者留出了充足的位置。
随着技术的日渐成熟,多云也正成为云计算新的趋势,企业客户在IT架构上选择多云策略,避免供应商锁定或确保业务连续性。“大概几年前来自第三方的调研数据显示,平均每家企业会使用三朵云。去年,我们也针对4000多家在云上消耗超过100万的企业客户进行调研发现,这一数字已经上升到了五朵云,并且已经有88%的企业采用多云架构。这是一个历史新高,以及未来这一数字还会上升。”火山引擎总裁谭待用自己的调查数据来看这个大趋势。
而在另一个维度,一些成熟的客户正在提出更高需求,这也在倒逼云计算服务商不断升级。但与国际整体局面截然相反的局面是,国内IaaS市场份额较高,但毛利率最低,因为过去公有云为主导的服务商策略是不断降价,依靠规模提高边际效益。相较而言,PaaS+SaaS业务虽然有巨大的发展空间,但现阶段渗透率并不高。而最近一段时间,ChatGPT的横空出世,给了云计算全新的想象空间。因为大模型所需的海量计算资源远远超过了绝大部分企业的能力,所以上云成为企业获取智能化能力唯一的选择。
火山引擎正处于这样极快的市场变化中。虽然入局晚,但它具备自己独有的实践经验:采用与字节跳动内外同源的技术架构,计算资源池实现共享。高峰期Serverless的QPS可达到过亿量级,每天6万多人在使用大量的数据引擎,数据BP(数据业务伙伴)制定出0987的服务标准……同时,抖音在全球炙手可热的生态,也成为火山引擎给生态赋能的强力基本盘。
所有这些,也构成火山引擎对于云计算一些独特的判断。
去年7月,火山引擎提出云上增长三要素:体验创新、数据驱动、敏捷迭代。谭待认为,数据驱动是企业增长的最核心环节,但很多企业数据中台的失败,不是技术问题,而是缺乏应用场景,“过去很多企业花费了大量时间构建数据中台,但最后失败了,找不到数据应用的场景,价值也没有发挥出来。其本质在于,企业没有将数据驱动整个体系设计好。”为此,火山引擎围绕数据消费来设计整个飞轮体系,是希望将数据驱动这件事情更往前走一步。
过去两三年,火山引擎依据内外实践和服务经验,构建出相对完整的技术栈:从IaaS层的自研DPU、抢占式实例SPOT,到分布式云原生平台、混合云veStack、多云安全平台、面向智能推荐的大模型训练引擎,再到围绕数据飞轮展开的一系列数据治理产品,以及各类体验创新解决方案如内容创作、数字人。
火山引擎的思路是,不会完全按照“上个时期”卖一模一样的公有云产品,只依靠降价与其他服务商死磕,这种路径并不可取。“云本来就应该不断降低成本,只有在规模上做到足够大,有足够资源支持技术团队创新,自然会有更多成本优化的空间。云服务应该将这部分省出来的利益让渡客户,客户也才会持续用云。”谭待说。
而对于存在变化、可产生新机会的领域,火山引擎则会持续发力、加大研发投入,自研DPU是,升级模型训练平台是,构建数据飞轮体系也是。这样的好处在于,对内服务会有更极致的性价比,在云市场未来也会带来阶段性的竞争优势。
走到这个阶段,云的差异性可能并没有想象中那么明显。但火山引擎总会在你认为云只存在唯一解法的时候,站在业务视角,带给你新的解决思路。
火山引擎总裁 谭待
4月18日,火山引擎发布一系列面向云原生架构的产品,宣布与字节跳动国内业务并池。在发布会之前,火山引擎总裁谭待和钛媒体联合创始人刘湘明就火山引擎的发展战略,以及当下云市场的趋势等话题,进行了深入的一次沟通,展现了火山引擎对于云计算独特的判断和价值观。
观点摘录:
1.“不急于推出只有30分的大模型,核心是赋能其他人做这件事情”
2.“一切围绕数据消费设计数据飞轮,不会一开始就搭建过于静态的数据体系”
3.“可能在资源有限的范围内能做好,但如果要做1000个集成项目,就做不好”
4.“云和办公协同是两个完全独立的赛道,如果非常重视这两件事情的公司,应该让他们分开发展,做好协同”
5.“云服务仍有很多创新点没实现,目标将pay as you go做到更细颗粒度”
刘湘明:字节是一个云原生的企业,怎么总结字节自己在应用云技术方面的经验和方法论?
谭待:云原生很早就有其标准定义,现在再去谈云原生,它的意义已经发生了泛化。更重要的是,企业如何利用云的特性重新设计应用架构,将云的价值(如弹性、成本)最大化利用,实现在数字化转型中的快速迭代。能做到这一点,我认为是云原生的企业。
具体如何展开?一是在基础层,利用容器、微服务、DevOps等关键技术组件进行统一管理和编排,以支撑业务的弹性扩缩容。企业多余的IT资源进一步释放,降低运营成本;二是构建多云架构,企业通过私有云将关键数据保留在本地,也同时需要公共云支撑其他业务,使业务能够在多个云之间快速迁移;三是利用更先进的PaaS、SaaS加速业务迭代,减少重复造轮子。
无论是我们自己用云,还是做云都会关注到这一点。
刘湘明:所以你们多云的经验很丰富,对吧。
谭待:在多云方面的实践,字节可以说是经验最丰富的一家。很多云厂商说自己有经验,却没有亲身实践过。我们相信未来一定是多云架构,每个云都有自身所擅长的特征,且企业也不希望被一家云供应商锁定,尤其是希望做全球化业务时,一定是多云的选择。
大概几年前来自第三方的调研数据显示,平均每家企业会使用三朵云。去年,我们也针对4000多家在云上消耗超过100万的企业客户进行调研发现,这一数字已经上升到了五朵云,并且已经有88%的企业采用多云架构。这是一个历史新高,以及未来这一数字还会上升。
没有必要跟客户一定要绑定,还不如大方讲出来。目前我们构建的基础设施和平台产品,在帮助企业构建多云体系的同时,实现云原生。
刘湘明:多云也是火山引擎反复强调的一个优势。从技术到应用层面,多云会遇到怎样的挑战?
谭待:无论是从成本,还是供应商锁定、安全等角度考虑,企业都会选择多云或多供应商策略:自己构建平台或集成第三方PaaS能力,通过更高层次的抽象实现多云管理。例如,在容器环境下,大部分的业务负载可以实现联邦集群调度、多云CDN调度;同时,针对某些有状态的应用如存储、数据库等,也可以实现容器化(云原生)改造。只有做到这一点,企业才能有足够的选择权,与任何一家供应商进行合作。
我们的思路是,顺应多云趋势,以构建更多的多云工具。火山引擎构建了基于K8s的分布式云原生平台,能将私有云、公有云或其他云实现联邦调度,帮助企业实践多云,在此基础之上,加上IaaS层通过持续的自主研发、技术创新不断追求极致性价比,实现为企业长期合作的策略。
刘湘明:Serverless的进一步发展,对多云策略也应该是个利好。
谭待:是的。Serverless带来了对云更高层次的抽象,对云的使用也会更加极致。但Serverless给云服务商也带来了许多挑战,比如隔离技术、小型化、集群的扩缩容等问题。
字节跳动本身就在大量使用Serverless形态的应用/功能。比如,抖音的负载有很多是基于事件驱动型应用,如“交互”、“评论”,就可以基于Serverless构建。在高峰期,(单节点)Serverless的QPS可达到过亿量级,在响应、延时等方面都已实现很高的水平。
Serverless概念十年前就出现了,但当时技术并不成熟,Serverless也无法支撑大量的在线业务。如今,Serverless不仅改变了云的计算方式,还可以结合数据分析、数据湖实现新的方案,企业也在基于Serverless进行多云迁移。
刘湘明:Serverless的出现,使云基本达到了当初设想的状态。
谭待:但还是要不断向前走。企业本身是一个复杂的决策体,比如它之前已经有很多遗留资产,如果想要全部改造成Serverless,本身就存在一定的难度,而且未必会对这些老旧系统有帮助,这时就需要有更多新的解决方案出现,才能推动企业顺利迈向下一阶段。
刘湘明:公有云的竞争日趋白热化和同质化,不久前阿里云也在宣布降价,火山引擎的优势在什么地方?
谭待:云应该具备“多快好省”的特点,本来就应该不断降低成本。规模足够大,应用的创新技术越来越多,自然会有更多成本优化的空间。对于云服务商而言,应该将这部分利益让渡给客户。这也是客户为什么会持续用云的一个原因。
虽然火山引擎在ToB市场还是个新入者,但我们采取的是字节跳动内外同源的技术架构,计算资源池实现共享。例如,抖音、头条采用的都是火山引擎的计算服务,通过内外统一的资源管理和优化,可调用百万台云服务器,具备足够大的计算规模。
正是有这样的实践基础,才能保证我们长期保持足够强的竞争力。云市场依然存在增量,仍留有足够多的位置留给后来者。
大模型对算力的影响
刘湘明:弹性对于互联网企业是个特别头疼的问题,但对于很多传统企业就不是个问题,因为基本上它的增长都是线性的。原来为什么要上云一直是个灵魂拷问,对很多企业来说,上云成本跟本地计算综合算下来相差无几,还面临知识体系升级的挑战。但GPT是个很大的机会,GPT的计算需求环境超过了绝大部分企业的资源,要实现智能化,上云变成唯一选择。
谭待:无论是大模型还是GPT,它的出现对云而言肯定是一件好事,因为它把计算的门槛提高了。企业或个人开发者,自己训练一套模型的成本很高,需要有云平台作为支撑。但问题是,现在大模型出现了,云厂商并没有做得很好,或给出更好的解决方案。
其次,过去,企业的数字化应用可能只是将数据存储起来,而现在它还可以用训练好的模型分析更多的Insight,对业务优化产生更大的价值,在内部流程、工作效率各方面进行提升。这要求企业拥抱更多的AI技术,进一步带动对算力的需求,由于这些需求最终能为企业带来整个生产力的提升,所以对于企业而言也是赚的。
刘湘明:火山引擎的大模型,会在什么时候降临市场?火山引擎的大模型解决方案里包含什么特色能力,企业选择火山引擎大模型的优势是什么?
谭待:关于大模型,未来可能是这样一个逻辑:IaaS+MaaS+应用。
在这个阶段,MaaS(Model as a Service)其实都没有做到很好的状态,包括国际上做的比较好的还处于开始阶段,国内也存在很大差距。就像GPT-3刚出现时也挺火热,但并没有在产业界掀起太大浪花,是因为GPT-3的能力还没到及格线,只是一个玩具。当前基于大模型做应用创新,时间还太早,要先将Model做好。
至于谁来做?OpenAI就是个例子。很多相对独立的公司反而有能力将这件事情做得很好。火山引擎会先把基础层服务好,然后再看如何服务上层场景,场景是很确定的。一方面可以摸着别人过河,比如微软的Office Copilot、Adobe的Firefly已经有了诸多尝试;另一方面,也会与MiniMax、智谱AI、昆仑等企业进行深度合作,通过构建工程化能力更强的机器学习平台,提高大模型训练的速度。
我们不急于推出一个只有30分且只能适用于本地部署的大模型,这不是最关键的,核心是赋能其他人做这件事情。
刘湘明:如果将GPT的出现看作是一次机会,它是不是也会对云的底层资源进行重新封装,提供一种新的交互界面?
谭待:其实语音转文字(ASR)的过程就是一种Serverless形态,它已经将场景往前推了一步。在此之前,企业基本上是在技术层面实现效率提升,终端用户的感知是比较弱的。
刘湘明:我最近也在重新思考一个问题,什么是软件?原来软件开发有大量工作,开发人员大量的精力花在了界面设计上,GPT的出现将这一问题进行极大的简化,只要把Prompt做好就可以。
谭待:以前的GUI都需要描述功能,现在可根据需求动态生成。很多人在讲“软件未来都会面临重写一遍。”这是个很美好的未来,大家也雄心勃勃,但过一段时间又会面临技术Hypercycle的问题。
数据飞轮和数据中台的关系
刘湘明:数据飞轮核心的逻辑是什么,能带来什么样的业务价值?
谭待:火山引擎去年提出了云上增长三要素:体验创新、数据驱动、敏捷迭代,其中数据驱动是最核心的一个环节,也是今天数据飞轮提出的起源。数据飞轮包含三个环节:数据生产、数据应用、数据消费,要将这些环节连接起来,相互促进之下,才会越转越顺。
过去很多企业花费了大量时间构建数据中台,但最后失败了,找不到数据应用的场景,价值也没有发挥出来。其本质在于,企业没有将数据驱动整个体系设计好,数据中台只是数据生产的一个环节。甚至也有企业会专门设立数据相关部门,但最终会出现一个悖论:做数据的部门无法通过数据来说明自身的价值。
字节跳动非常强调数据驱动理念,每天有6万人在使用大量的数据工具,这是一个非常夸张的数字。字节跳动内部数据平台团队提出了一个比较通用且有价值的度量标准:0987,0是零事故;9是满足90%的需求;8是80%的需求能够通过技术优化实现秒级调用;7是NPS,即通过业务部门评价达到70分以上。
所以数据飞轮的提出,是希望数据驱动这件事情更往前走一步,同时一切围绕数据消费来设计整个飞轮体系,而不是一开始就将搭建完整且过于“静态”数据体系为目标。
现在有些文章在谈论“拆中台”这件事,我觉得本质是大家还没有认清楚,中台建设与否的背后逻辑是什么。
刘湘明:现在很多人谈到中台总是用0或1来论成败,焦点都是集中在要不要。其实中台是个灰度,只是变厚或变薄的问题。另外,你刚才提到的数据消费是数据飞轮中的灵魂问题,与之配套的,一个是场景问题,很多企业都还没有做到需要很长时间落地,另一个是工具,你们现在会有哪些产品化动作?
谭待:过去我们曾发布了A/B测试、DataFinder、VeCDP、DataWind等各类工具,在数据底层还引入了批处理、湖仓、Flink等技术方案,未来也会持续升级。此次我们还将发布一个新产品——管理驾驶舱Plus,面向数据驱动的一号位,也就是企业CEO提供服务,实现敏捷、可交互、移动化。
刘湘明:火山引擎数据BP机制很吸引人,什么样的企业可以触发这样的机制?
谭待:数据BP是数据飞轮的一部分,也是与企业共创、与伙伴合作的环节。数据BP团队的存在,需要一批人员派驻到数据应用的业务场景。他们会与客户直接沟通,为客户解决实际业务问题,同时还会作为“教练”帮客户构建自己的数据BP。在未来,还会有广泛的方式如训练营,让客户更好地了解运作机制。目前我们跟华泰证券、得到进行了不错的尝试。
刘湘明:这件事情有点个性化,毕竟你们的资源有限,能做BP的人也是一定的。
谭待:其实最理想的应该是有第三方伙伴。火山引擎只用做其中的一小部分或者比较难需要开创性的工作,更多的服务是伙伴来完成。
刘湘明:今年有个政策趋势是数据资产化,这对很多企业也是个全新挑战。但大量企业并不知道如何利用、管理好这些资产。字节本身在这一方面应该是先行者,火山引擎认为正确的姿势和流程是什么?
谭待:隐私、安全、合规是做一切事情的前提,要把红线划清晰。技术层面,可以用联邦学习、隐私计算、隐私网关等等;其次就是数据用好的问题,很多企业都处于刚开始阶段;然后才是数据资产化,实话讲,我们自己也在探索,但至少把前两步做好,不然所谓的数据定价、交易这些事情都没办法实现。
云计算的商业路径
刘湘明:你怎么描述火山引擎的典型客户?
谭待:如果用一个典型的词来概括,应该是“重视数据驱动”的企业,都是我们会关注的客户。无论企业侧的业务支撑和流程优化,还是产业侧所倡导的“数实融合”、“数字中国”,本质上都需要做到数据驱动,绝大多数行业都会逐渐走到这一步。
可能这种说法比较“虚”,但实际应用是非常之多。
例如,在零售消费行业,企业希望对消费者进行更好的洞察,会通过全流程的用户行为管理,提升用户黏性;在汽车行业,以前车企根本不知道客户在哪儿,多以4S店分销模式呈现,现在车企可以利用数据在线,实现对用户全生命周期的数字化运营,指导生产过程优化、产品演进等等。此外,像自动驾驶、辅助驾驶场景,已经完全依靠数据驱动,对云与机器学习都有大量的诉求。
刘湘明:火山引擎是很多工具的组合,但对于很多行业用户来说,往往会感觉无从下手。你认为应用火山引擎的正确姿势和流程应该是什么样的?
谭待:有很多工具和技术只是一方面。企业自身的复杂性导致流程和机制成为最大的卡点。我们希望能与每个行业里有潜力的标杆客户深度共创,然后形成行业里的标准方案。
另外,这件事情能够实现得更快,前提是需要彼此更开放,对双方的组织能力都有很强的考验,打破以往落地难的问题。
刘湘明:共创其实是很多互联网公司都会做的事情。但是共创之后怎么形成产品能力?
谭待:这也是一个灰度问题。重要的是先想清楚哪些是不能做的事情,哪些是注定不可能产品化的,列好负面清单。这样再去尝试,你的试错成本就会低一些。
很多客户会讲火山引擎开发APP的能力会特别强,会希望我们全部帮他们实现APP开发。这一点,我们是坚决不做,因为它无法实现产品化。
刘湘明:你们的负面清单有多长?
谭待:也没有太长,而且很难一开始就全部想好。可以事件驱动,在立项之初就会基本判断清楚。
现在云厂商会反思不做集成的生意,是一样的道理。你可能在资源有限的范围内,能将集成做好,但是如果要做1000个集成项目,可能就做不好。
刘湘明:以银行客户共创为例,如果要做产品化,应该怎么做?
谭待:首先要明确目标,然后拆解共同目标下,彼此的职责和边界。对于需要共创的,比如手机银行App要提高月活和用户黏性,就需要有足够多关于个性化推荐的内容供给,足够多的内容分发入口,以及足够高的分发效率。这个过程势必会涉及到行业和符合企业调性,这时需要彼此花一定精力共商一套标准,标准也可以在未来固化到火山引擎的产品方案中。
刘湘明:目前企业内部应用的交互界面有向内部通信应用整合的趋势,火山引擎的交付界面是否会有意识向飞书统一?或者在协同方面有更加密切结合的可能性?
谭待:我们现在跟飞书也是很紧密的合作,同时我们也有彼此深入的客户。但是,云和办公协同是两个完全独立的赛道,比如微软的Azure和Office也是完全分开的。这两个领域的空间都足够大,如果是一家非常重视这两件事情的公司,应该让他们分开发展,做好协同。
刘湘明:如何建立好生态,去更有效地释放火山在后台积聚的能量?
谭待:企业需要有交钥匙的一套解决方案,这件事情靠我们自己肯定是做不了,就需要生态伙伴支持。我们的生态伙伴会比较多元,能够为企业提供一整套更完整的数字化解决方案,包括云业务,也包括电商和营销业务。目前,我们也在跟巨量引擎、抖音电商进行合作。
一定要守住自己的边界,不要老想做伙伴的事情。最终是要为客户创造价值。
刘湘明:未来会怎么考虑火山引擎的商业模式,还是会按照云的路径?
谭待:云经济本身就是一个很好的商业模式,也是最成功的共享经济模式,并且一直在创新。在pay as you go这个模式下,过去是按实例付费,现在可以按函数计算的调用次数付费,未来大模型也可以按token服务付费。
这条路径是可以一直持续的,仍然有很多创新点没有实现,我们的目标是将这种付费做到更细的颗粒度,帮客户省更多的钱。
刘湘明:能不能具体讲一下token这种模式。你对整个token的定价标准,有过研究吗?
谭待:其实微软就在做这件事情。它的逻辑是模型每预测一个token就会消耗一次计算,就可以按照token进行收费。未来的优化方向可能是尽量减少token的使用,从而降低成本。
不过,目前可能还没到token定价标准,这一步反而是比较清晰或者没有差异点的。当前阶段,尤其在国内,能不能拿出一个90分的模型,才是最重要的事情。
刘湘明:除了对基础层面构建极致性价比产品外,云成本管理(FinOps)也是当下在谈论的话题,火山引擎在这一方面有没有思考或产品化的动作?
谭待:我们在FinOps上做得非常强,从字节内部的实践来看,在火山引擎未成立之前,已经将内部所有的技术平台商品化,对内做定价结算,这是FinOps的基础。
目前客户对这些事情也非常感兴趣,我们会提供一些咨询服务,同时也在思考如何将这个过程产品化。
刘湘明:最近一段时间,火山引擎也计划开放海外数据中心,对于服务出海有哪些规划?
谭待:4月会启动东南亚1区,希望更好地服务出海客户。其中游戏、电商行业客户肯定是主力,也会优先去服务这些客户。此外,在抖音电商、抖音本地生活开展业务的很多中小客户,首先需要的不是云,而是能够围绕其开展生意的一系列SaaS效率工具。为此,我们可以将这些工具打包成一个方案,比如“生意云”。
刘湘明:服务出海第一步最难的问题是什么?
谭待:最重要的还是case。基于海外合规资质,设计出符合客户业务形态最好的方案。
刘湘明:过去一年,云厂商都在进行大幅组织架构的调整,火山引擎在当前这样一个阶段,如果有必要会朝着哪个方向进行改进?
谭待:组织调整本身是一件很正常的事情。在业务不同发展阶段,都会有最适合自身的组织形态。火山引擎也有类似的形态,从刚成立到推出云基础服务,再到开展更多行业,这都是到某个阶段才会考虑的事情。我有个教训,就是不要做组织的over design,有多大的业务就构建多大的组织。