文|真故研究室 林秋艺
编辑|龚 正
两三年前,继马云、刘强东、黄峥相继退居二线后,字节跳动创始人张一鸣也选择在2021年5月20日这天宣布卸任字节跳动CEO。2年来,张一鸣的公开动作一直集中在教育公益上。媒体传他大部分时间也待在新加坡,“聚焦远景战略”。
直到最近,他在香港特区成立了一家个人投资基金,在资本市场重回公众视野。消息人士称,这家基金将聚焦科技投资。联想到媒体报道他最近热衷于研究AI大模型,以及港府释出将在本地建人工智能超算中心的计划,有投资行业人士告诉《真故研究室》,利用香港金融优势,进行AI的生态布局或将是张一鸣接下来要展开的重点。同时,市场也有未经相关方确认的信息流传,即字节跳动可能将于年末发布自己的大模型。
01 选中香港,整活AI
Cool River Venture。
这是挂在香港特区公司注册处网站上,张一鸣成立的个人投资基金名字。这也是卸任字节跳动CEO两年以来,张一鸣在资本市场上的首次露面。
该基金性质是私人有限公司,2023年5月22日生效,张一鸣担任该基金董事,唯一股东为Galaxy LLC,持股比例为100%。
据相关人士透露,该基金的主要投资方向是科技行业。
这不难让人联想起字节跳动“要做自己的大模型”这一动作。
在此之前,张一鸣已经主动或被动释放出很多信息。多项消息指向,AGI(通用人工智能)是张一鸣关心的重点之一。
《中国企业家》杂志报道,张一鸣最近正在看一系列的OpenAI论文,甚至熬夜看,已经到了废寝忘食的地步。
一位字节员工在接受《晚点》访谈时也说,张一鸣近期时常会和一些字节人士分享论文学习心得和对ChatGPT的思考。
如今,选择在中国香港成立个人投资基金,或是张一鸣准备开始行动的信号。
有投资行业人士告诉《真故研究室》,选择中国香港成立基金,不但注册简便易行、基金结构简化、筹资容易、税负较低,也可以依托香港地区,辐射大湾区,利于进行AI行业的全球生态布局。
值得注意的是,就在5月31日,百度也正式宣布设立规模为10亿元的「百度文心投资基金」,重点投资孵化大模型领域的优质创业企业,为其提供包括资金、技术、人才在内的一站式资源。
除了金融因素外,香港特区政府近年来,也在加码对AI领域的重视和投入。
在香港特区2023至24财政年度的财政预算案中,数字经济是重要发展规划。
按照计划,香港将拨款逾7亿港元来加快数字经济的发展。同时,为了推动香港的科研和人工智能产业发展,香港特区政府就建立人工智能超算中心进行可行性研究,并在2023/24年度完成。
图 | 来源于香港特区2023-24年财年预算片描述
5月16日,香港也扩充了优秀人才吸引计划名录。这一计划从2018年开始实施,初期只包含11个职业。2021年扩充到13个职业。而5月16日的这次人才扩招,则一口气扩充至51个职业,其中就包括人工智能、云端基础设施、软件、创新及科技、数据科学、网络安全这些方面的专家。
投资人士认为,香港地区港币、美元资金丰富,这也为该地区的AI投资创造了良好条件。而张一鸣在香港成立基金,投资科技行业,也有利于将来与字节自研大模型形成生态协同效应。
02 字节推自研大模型,年底能成吗?
虽然张一鸣已卸任CEO,但依然是字节跳动重大战略的筹谋者。从张一鸣的布局来看,字节跳动并不想缺席这场AI盛会。
目前,阿里、腾讯、百度、华为等10余家大型公司都发布了自己的大模型,市场也很关心字节跳动何时推自研大语言模型。
一位接近字节跳动的人士告诉《真故研究室》,时间节点或在年底,智能化程度将瞄准GPT-4。不过该消息并未获得字节跳动官方确认。
从市场释放的公开信息看,字节跳动在大模型上的布局分为语言和图像两方面。如同百度推的文心一格和文心一言。
语言大模型由字节搜索部门牵头,目前团队规模在数十人左右,或会借鉴ChatGPT的经验,在抖音、Tik Tok上推出类似New Bing的功能;
图像大模型团队则由产品研发与工程架构部下属的智能创作团队牵头,或以服务商业伙伴为主,帮助字节的广告客户以更低的成本制作图片、视频等材料。
两个团队负责人的直接或间接汇报对象,均为Tik Tok产品技术负责人朱文佳。
对于字节跳动推自研大模型,市场上有声音认为,时间上入局晚了。不过也有声音提出异议。
一家投资机构负责人告诉《真故研究室》,按照字节跳动过往风格,它研发大模型“不是上来就吹牛的逻辑”,而是闷声干事。再者,这一领域并不存在早发晚发的优势。
从目前看,研发大模型、类ChatGPT应用与布局AI的时间关系并不大,但与算力、算法、数据以及资金的关联紧密,而恰好字节在这个层面上有较大优势,可以静观其产品。
但字节同样有着自己的短板,一是在AI生态的布局上起步较晚,二是参与生态布局的企业不多。
公开资料显示,字节在AI领域的投资只有5笔,但在企业服务、文化娱乐上的投资分别达到了51笔和44笔。显然,作为互联网科技大厂,字节在AI领域的投资是不够的。
而在2017年决定All in AI的百度,在2018年就以13起投资事件居于AI领域最活跃的企业风投公司名单榜首。2022年,百度新增投资了4家AI企业,全部是之前从未投过的新项目。
阿里对AI赛道的布局则始于2013年对小i机器人的投资。随后的这些年里,阿里连续投了商汤科技、寒武纪、元戎启行、思必驰、七牛云等代表性的AI公司。
而BAT最后的腾讯,也在2022年投资了9次AI赛道,其中有3家是对过往被投项目的追加投资。
03 百模大战,同质化中谁能率先盈利
短短半年内,国内大模型已经经历了从无到有、到百模大战的地步。然而,问题也来了,即“产品同质化”。
很多国产大模型都是用ChatGPT来喂养自己,各大厂算力水平接近、数据量相差不大、技术上也没有重大突破,反而都面临着类似的短板。
图 | 来源于《AIGC发展研究报告1.0版》,清华大学片描述
在数据生态方面,国产大语言模型都标榜自己更懂中文,但实际上中文数据生态远不够英文数据生态庞大,这也是国产大语言模型经常出现事实性错误的原因。
算力问题则是老生常谈了。虽然英伟达A800和A100芯片性能差距只有5%,但英伟达已经又推出了新一代计算卡H100了,而A100国内依旧买不了。
此外还有一个最重要的问题,如何商业化落地,并尽快获得盈利。
目前,一些先发者在摸索商业路径上的思路主要是向B端收费——先打造所谓的大模型生态,然后向B端提供解决方案,获得收入。
百度在这方面的动作比较多,正积极扩大B端客户规模。
据百度官方消息,文心一言刚发布时便有超650家合作伙伴接入,截至目前已有超300家生态伙伴参与文心千帆大模型的平台内测,合作伙伴主要集中在金融科技、IT服务、办公生态、算力等领域。
阿里大模型的生态,更优先布局旗下各产品线。包括天猫、淘宝、钉钉、高德地图、优酷、盒马等在内的产品,都在陆续接入通义大模型。其目的被认为既能内测产品,又能为市场打样。
目前,大模型如何向C端收费,国外主要是会员付费订阅模式。但国内受限于产品本身的成熟度(即还没有达到GPT-4这样的成熟程度),估计这条路短时间内还没有到付费时机。
回到字节跳动的大模型会如何商业化,在目前产品还未出的情况下,猜测无益。倒是字节跳动旗下的火山云,在大模型的变现路径上稍微清晰一些——向大模型创业公司提供算力支持。
网上流传的一份《阿里云AI专家交流纪要0401》显示,在国内大厂的AI算力储备中,字节跳动排名第二,仅次于阿里。
大模型训练需要巨大算力支持,而云厂商是公认的算力等基础设施的最佳载体。
对火山云来说,这样的商业化落地清晰明确,远比烧钱做大模型研发更能保证资金正向流动。
目前,围绕大模型的方向,市场主要有两类声音。
一是企业们不再需要浪费时间和精力去“重复造轮子”。二是认为 “多云多模态”才是AI浪潮的发展方向。
不过,还是那句话,能挣到钱的才是讨论方向问题的关键。前两年,元宇宙概念火爆,不管是行业还是学界,围绕元宇宙,也有过“世界终极将只有一个元宇宙”还是会有多个元宇宙的讨论。
事实证明,这些讨论不说无用,而是由于用户体验没有做到转折点、商业模式自然也无法跑通,导致的结局就是:高大上的元宇宙也会成为蚊子馆。
放在大模型上也一样。据国盛证券此前对GPT技术训练成本的估算,GPT-3训练一次的成本约为140万美元。对于一些更大的大型语言模型,训练成本则在200万美元至1200万美元之间。
运行费用本身也是天价级别。以 ChatGPT在1月的独立访客平均数1300万进行计算,其对应芯片需求为3万多片英伟达A100 GPU,初始投入成本约为8亿美元,每日电费则在5万美元左右。
目前显然各家都还处于烧钱赚吆喝的状态。关注字节跳动何时推大模型,可能行业更大的关心是,如何能盈利。