火山引擎总裁谭待会后接受采访 图源:火山引擎
自大模型被视为增长新动力,在红海厮杀的云厂商无不争先恐后想要抓住这一机会,尤其后来者,更需要一个急转超车的时机。
但火山仍然迈出了谨慎的一步。6月28日,字节跳动旗下火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等服务。目前,“火山方舟”集成了智谱AI、MiniMax、百川智能等多家AI科技公司及科研院所的大模型。这也是字节跳动首次对外正式公布大模型业务相关的进展。
这意味着,在百度、阿里、腾讯等一众互联网大厂押宝自研大模型的时候,字节选择了一条成本更低、切入更快的路:搭建一个聚合第三方生产商的大模型“商店”。
某种程度上,这也更符合字节跳动的习惯,连接供应商和使用方,最终凭借优化到极致的服务效率,成为产业生态中至关重要的一环。
做性价比最高的“卖水者”
每一次技术的大变革,往往都会带来体验创新的巨大机会。
“十年前,中文互联网开始从PC时代转向移动时代,这其中最大的技术创新就是个性化推荐算法。五年前,4G技术开始普及,带宽不再成为瓶颈,以抖音为代表的短视频,也正是在这次技术变革期间涌现出来的新体验和新交互。时间来到现在,大模型已经当仁不让拿起了技术革新和体验创新的接力棒。”火山引擎总裁谭待在发布会中表示。
根据第三方报告显示,中国已发布的10亿参数以上的大模型有79个之多,在全国14个省市/地区均有团队在开展大模型研发。谭待指出,做好大模型,不仅需要算法、数据和算力这三大要素,还需要解决安全与信任、性价比和生态系统这三大难题。
火山方舟正是为解决这些问题而生。据谭待介绍,在模型生产端,火山引擎已经通过优秀的算力系统和机器学习平台证明了自己,成为众多大模型企业的首选;在模型应用端,面对多模型生态和企业1+N应用模式,同样需要提供更好的产品和方案,解决计算、安全、成本等通用问题。
“让交易成本足够低,让替代成本足够低,这样才能不断降低大模型的使用门槛,让众多企业可以更加高效地应用大模型技术。”
不过,谭待在接受时代财经采访时表示,价格低不是一个商务手段,而是要通过技术,持续把成本做低,因为短期降价最后用规模换收入不可行。“我们虽然说性价比,但是我们强调通过技术来实现性价比。”
火山引擎智能算法负责人吴迪则对时代财经透露了具体的定价模式:即将算力资源提供给大模型供应方,供应方在刨除IaaS层面的成本后,叠加他们认为合理的利润,最终在火山方舟上报价。下游客户目前仅需支付模型服务费,平台服务费会在较长时间内设置为零。
时代财经注意到,这场发布会上登台的合作伙伴,包括智谱 AI、百川智能、IDEA等,都是当下国内第一梯队的大模型开发商。
至于怎么把成本做低,吴迪也列举了一些技术手段,“我们花了很多年的时间深耕技术内功。第一是基础模型优化,包括算子优化等。第二是基于云的规模化效应,利用错峰、训推一体,把整体利用率打上去,就能把单位价格打下去。”
字节没有放弃“淘金”
今年4月,在火山引擎原动力大会后的采访中,谭待就曾明确表示,“火山引擎自己是不做大模型的”,而是将接入多家大模型深度合作,为大模型厂商提供服务。
自ChatGPT火爆以来,在各大云厂商的发布会中,大模型都占据着主旋律的地位。就在火山方舟发布的同一天,中国联通也发布了自己的图文大模型“鸿湖图文大模型1.0”,称其拥有8亿训练参数和20亿训练参数两个版本,可以实现以文生图、视频剪辑、以图生图等功能。
往前追溯,从百度的文心一言,到阿里云的通义千问,再到腾讯推出MaaS大模型服务,喊出为每个企业“量身定制”大模型的口号,各大厂商逐一登台,各家的打法也在探索中日益清晰。
目前来看,对于火山引擎来说,其客户为上的思路和AWS有相似之处。此前,亚马逊AWS宣布推出生成式 AI(AIGC)工具“全家桶”,包括用于生成文本、分类、开放式问答和信息提取等任务的生成式大语言模型以及文本嵌入大语言模型等,瞄准的也是企业客户。
吴迪指出,和其他很多云厂商单纯提供算力不一样,火山方舟一方面会在资源和优化上与模型提供商进行深度合作,把推理成本往下打。另外一方面,火山算法团队会和客户做重点的应用共建和应用落地。“我们想催化整个大模型大算力在千行百业的落地速度,这应该是两者最大的不同了。”
火山方舟的推出,并不意味着字节在集团层面放弃了淘金者的角色。“火山方舟是个开放的平台。字节内部其他团队,如果做好了模型,大概也会上到方舟平台上对外提供,它在方舟上就是众多模型的一个。”谭待表示。
至于未来如何平衡自研模型和外部供应商,谭待认为,这是客户自己的选择,不需要火山来平衡。“一个企业未来一定会在多个场景应用多个模型,因为每个模型在不同场景性价比是不一样的,这是一个开放的市场,自然而然取得平衡。”
不过,无论是卖水者,还是淘金者,有一点是毋庸置疑的,在大模型这条曙光乍现的大道上,可能会迟到,但没有人敢缺席,因为缺席的代价太大。