陈永伟/文
最近,一款名为Character.AI的聊天机器人火爆了全网。这款产品最大的特征是它可以扮演各种名人的角色,用他们的风格和观点来和用户进行对话。比如,如果你是一个马斯克的粉丝,很想听听这位首富对科技、对未来的想法,那么就可以和Character.AI扮演的马斯克进行交流;如果你想听听巴菲特对投资的看法,就可以让Character.AI扮成这位投资教父来亲自“陪聊”;甚至如果你愿意,还可以直接复活康德、黑格尔,同这些先哲探讨一下他们的哲学体系。
很显然,比起ChatGPT这样一款“无情的AI助手”,能够“变脸”的Character.AI可以给用户带来更多的亲和力和新鲜感。根据第三方应用程序情报提供商data.ai的测算,Character.AI的应用程序端上线一周,其下载量就超过了170万,对比之下,ChatGPT上线第一周的用户量则只有50万。
虽然这种直接的数字对比忽视了很多因素,例如它没有考虑ChatGPT对AI聊天机器人的市场教育作用,也没有考虑Character.AI在之前已经推出过了在线版。但无论如何,170万的周下载数据还是说明了Character.AI相当火爆。这个火爆的应用由诺姆·沙泽尔(NoamShazeer)和丹尼尔·德·弗雷塔斯(DanielDeFreitas)率领的团队制作。而这两位都是谷歌的前工程师,并且在其离职前曾经领导过一个名为LaMDA的AI研究项目。
说起LaMDA,大家或许有些陌生。但如果关心AI领域的新闻,就一定会对2022年年中时的一则关于谷歌AI觉醒的报道有所记忆。当时,谷歌的一位AI伦理工程师向外界披露,谷歌正在研发的一款AI产品似乎已经觉醒了意识,它不仅可以和人们进行一般的对话交流,甚至还可以和人讨论哲学、探讨佛理。当时,很多人认为,这不过是谷歌为了宣传自己的AI产品而做的炒作。不过,仅仅半年之后,ChatGPT的横空出世则向世界证明了,这些能力确实是AI力所能及的。因此,似乎也可以说,AI能力长期在全球第一的谷歌在当时已经做出了一个能和人谈笑风生、谈经论道的AI。
既然谷歌手里早有了像LaMDA这样高能力的AI产品,那么,为什么它不在第一时间发布该产品,并将其和自己的应用生态绑定,反而给了OpenAI这样的创业公司机会呢?
在事后,很多人对谷歌捂着新AI产品不发布的原因作出了解释。一些观点将其归咎于谷歌现管理层态度的不思进取;另一些观点则认为这是一种“创新者的窘境”——由于AI产品的用途和谷歌现有的搜索业务存在着一定的替代性,所以谷歌不想让AI产品对其搜索业务产生冲击。但是除了这些原因外,可能还有一个非常重要的原因,那就是谷歌面临的反垄断压力可能迟滞了其在AI领域的布局。
“垄断者”谷歌阻碍了AI发展吗
作为GAFA当中的那个“G”,谷歌一直是各国反垄断机构重点关照的对象。在欧洲,它因“谷歌购物比价案”被罚24.2亿欧元(约合27亿美元)而一直保持着全球反垄断罚款金额的记录。而在美国,近年来它也一直面临着反垄断诉讼的威胁。
早在2020年时,当时特朗普政府的司法部和十一个州就分别对谷歌提起了反垄断诉讼,指责其通过在网络浏览器和移动设备上进行预装等手段维持其在搜索引擎市场上的垄断地位。此后,美国政府换届。按照惯例,很多“前朝”司法部提起的诉讼会在新政府组建后被撤销或和解。但这一次,事件并没有按照这种惯例来发展。在拜登接任美国总统之后,就任命了被誉为“谷歌宿敌”的乔纳森·坎特(JonathanKanter)作为司法部专门管理反垄断事务的司法部助理部长。之后,司法部不仅保持了2020年提起的诉讼,并且在今年1月又联合八个州对谷歌在广告技术市场上的垄断行为提起了一起新的诉讼,在这起新的诉讼当中,司法部甚至明确提出了拆分谷歌广告业务的要求。
今年4月,审理这两起案件的哥伦比亚特区联邦法院对这两起诉讼进行了一次听证会。在听证会上,司法部的代理律师肯尼斯·丁策(KennethDintzer)在陈述其代理意见时,对谷歌垄断地位和AI发展的问题进行了一番论述。
丁策认为,正是由于谷歌的垄断地位阻碍了生成式AI等新产品的推出。他指出,在微软宣布要将OpenAI的人工智能聊天机器人ChatGPT纳入必应搜索引擎后的几天,谷歌就宣布要推出类似ChatGPT的产品,而这才是“真正的竞争应该有的样子”。在他看来,如果在搜索引擎市场上充满了竞争,那么类似ChatGPT这样的产品或许早在几年前就已经产生了。
经过彭博新闻等重量级媒体的报道,丁策律师的这番慷慨陈词很快就传遍了网络,“谷歌垄断阻碍了AI发展”这个论断也因此而被不少人接受。我想,谷歌的领导层在看到这份消息的时候,心情应该是崩溃的——本来,在AI市场上让OpenAI抢了先手就已经是让谷歌非常恼火的事情,而现在司法部竟然还把这一切归咎于其自身的垄断。
在我看来,丁策的这个观点是很难站得住脚的。原因如下:
第一,包括ChatGPT在内的众多大语言模型的基础架构,正是“垄断者”谷歌提出的。
在传统的自然语言模型中,长期记忆问题一直是一个难以突破的关口:一个词究竟是什么意思,是和它的上下文相关的,比如“256G苹果”指的可能是256克的苹果,也可能是指内存量为256GB的苹果手机,究竟是哪个意思,需要联系上下文看。这个特征就决定了在对文本的意思进行编译时,必须时刻考虑之前的文本,因而文本处理就被锁死了是一个串行运算过程。如果这个问题不解决,就不可能大幅提升自然语言处理的效率,后续的各种大模型也就无从谈起。
而破解这一难题的,正是谷歌。2017年,谷歌的几位研究人员发表了一篇题为《注意力是你所需的一切》(Attentionisallyouneed)的论文,在文中,几位作者引入了“自注意力”(self-attention)的概念构建了Trans-former架构,从而创造性地解决了长期记忆这个难题,这才使得自然语言处理得以从串行运算变成了并行运算。在此之后,AI领域的众多专家纷纷采用这个架构开发和训练自己的模型,才有了这一轮的生成式AI爆发。
很显然,如果谷歌方面希望保持在AI领域的优势,并且借以维护自己在搜索及广告等业务上的垄断,那么它当时最优的选择就是关起门来,偷偷用它训练出优秀的AI产品,然后把它集成到自己的应用生态当中去。或者,它也可以禁止其竞争对手使用这个架构,毕竟它已经为Transformer申请了专利,是有权这么做的。但在现实中,我们没有看到谷歌做上面的任何一条。
第二,谷歌自身也没有放弃过对AI产品的开发,在过去几年中曾经研发出大批产品。仅在自然语言处理领域,谷歌就在提出了Transformer框架之后,又提出了BERT模型。在业界,这一模型一直被视为是和GPT比肩的模型。在具体的大语言模型上,谷歌也开发出了多款比较成熟的产品,比如前面提到的LaMDA,以及后来发布的Bard等,性能都不错。如果再考虑到谷歌参与或者控股的产品,那么成功的案例就更多了。
无论是从自身的产品角度看,还是从对行业基础技术的贡献角度看,谷歌都可谓是AI领域的功臣。要说是它拖累了AI的发展,恐怕是怎么也难以讲得通的。
但为什么会在这一轮的生成式AI热潮当中,谷歌会落后于OpenAI这样的后起之秀呢?其原因可能还是反垄断的压力。我们可以想象一下,如果在谷歌开发了LaMDA、Bard等产品之后,第一时间就发布,并将这些产品及时融入到了自己的生态,那它是否可以在今天避免司法部的指控呢?我想,答案是否定的。在这种情况下,丁策律师或许会换一番说辞。比如说,谷歌正在通过不断革新技术,并通过将AI产品与旧业务捆绑等方式,强化自己在搜索引擎市场方面的地位。这同样可以让谷歌百口莫辩。
如果我们站在谷歌的位置上进行一下思考,就会发现它现在其实处在一个非常尴尬的地位。作为一个“垄断者”,它已经在搜索引擎市场上占有近九成的份额。在这种情况下,同样是把AI整合到搜索,如果是OpenAI和必应来做,那就是创新;但如果是它来做,就是垄断,是滥用自己的市场支配地位。也正是因为需要时时担忧类似的指控,所以谷歌才会在AI新产品的推广上慎之又慎。从这个意义上讲,如果硬要说谷歌的垄断对AI领域产生了什么负面影响的话,那么更有可能是“垄断”这顶帽子束缚住了谷歌在这个领域开拓的步伐,而不是其垄断行为真的阻碍了行业的发展。
垄断和创新的关系究竟是怎样的
关于谷歌是否阻碍了AI技术发展的讨论,其实是“垄断与创新”这个话题的一个典型案例。
在经济学领域,关于垄断与创新的关系一直存在着两种截然不同的观点:
一种观点来自于熊彼特。在其1942年出版的著作《资本主义、社会主义与民主》当中,熊彼特认为,更为集中的市场结构可能是有利于创新的进行的,那些垄断的大企业可能是创新的主要力量。他指出:“一旦我们深审细节,去探究最为瞩目的个别项目时,引导我们的线索不是把我们带到在比较自由竞争条件下工作的那些企业面前,而是把我们带到大公司的门前”。熊彼特的理由很直接:创新通常需要巨大的投入,并且有很大的规模效应,因此只有垄断的大企业才有能力来做这些,并且只有由垄断的大企业来做这些才是有效率的。
与之相对的另一种观点来自于诺贝尔奖得主肯尼斯·阿罗。他在1962年的论文《经济福利和创新资源的配置》(EconomicWelfareandtheAllocationofResourcesforInvention)中指出,竞争的市场结构要比垄断更能够激励创新,垄断除了造成静态条件下的社会福利损失之外,还会对技术的进步造成阻碍。阿罗的逻辑也很直观:企业的决策从本质上是一个成本收益权衡的结果,一个企业只有发现在创新的收益大于成本时才会这么做。在什么时候,企业的创新收益才能超过成本呢?一个重要的条件是这项创新可以帮它获取很多的市场。在一定时期内,市场的总规模是有限的,因此从某种意义上看,创新企业获取了更多的市场份额,其实就是夺取了其他企业的市场份额。在经济学上,这种效应叫做“业务窃取”(Business-stealingeffects)——这儿的“窃取”更多是一个中性词。很显然,对于在位的垄断企业和一个不在位的竞争性企业来讲,创新带来的“业务窃取”效应对它们的影响是截然不同的。如果市场上只有一个垄断企业,它就会缺乏创新的动力;而如果市场结构是更为竞争的,那么企业创新的动力就会更足。
在相当长的一段时间内,熊彼特和阿罗的上述观点几乎主宰了经济学界关于垄断和创新问题的讨论,并且各自收获了很多的信徒。如果看更为具体的实证研究或者案例分析,我们会发现,两种观点都有成立和失败的时候。那么,出现这种情况的原因究竟是什么呢?我们是应该信熊彼特,还是应该信阿罗呢?
对谷歌案例的再考察
要简单地评价上面两种观点究竟谁对谁错,是没有太大意义的。无论是熊彼特还是阿罗,他们的论证都是建立在非常简单化的假设之上的。在现实当中,情况要远比他们设定的复杂。
在面临一个特定的案例时,我们应该首先搞清楚很多问题。例如,在这个案例当中,市场的结构究竟是由什么因素决定的?这个市场当中究竟有谁在创新?进行的是怎么样的创新?这些创新可能会对既有的市场结构产生怎样的影响,对企业本身又会产生怎样的成本收益?
首先是市场结构问题。在经济理论当中,市场结构的决定因素经常会被抽象地简化为成本、技术等几个简单的因素,但在实践当中,这些因素的表现是十分多样化的。换言之,每一个具体的市场都有着影响其市场结构的特殊力量。比如,在一个区域零售市场上,物流体系的构建可能是决定市场结构的最根本力量;而在一个医疗机构的市场上,决定市场结构的最主要因素则可能是行政上的准入制度。在给定了这些因素之后,其他条件可能产生的影响通常会微乎其微。举例来说,试想在某一个地区,对于医疗机构有着非常强的行业准入制度,那么我们就可以预期,即使进入医疗行业的潜在利润非常大,新的竞争者也很难出现。
其次是创新主体问题。如果我们仔细体会一下熊彼特和阿罗两人关于市场结构和创新的讨论,就会发现,虽然他们讲的都是创新,但侧重的方向是不同的。熊彼特侧重的更多是创新主体的创新能力;而阿罗侧重的则是创新主体的创新意愿。所谓熊彼特强调垄断促进创新,其实是说垄断者具有更强的创新能力;而阿罗强调竞争促进创新,其实是指竞争市场下企业更有创新的动力。在现实中,创新的最终实现是意愿和能力共同作用的结果,所以在分析某个企业的具体案例中,我们必须认真地找出这个企业的创新动力究竟如何,以及它们究竟有没有能力去实现这一切。当然,无论是创新能力还是创新动力,都往往是和具体的市场结构相联系的。
再次是创新内容问题。无论是熊彼特还是阿罗,在分析市场结构和创新时,都没有仔细区分创新的类型。但事实上,不同企业进行的创新通常是不一样的。一般来说,对于实力相对雄厚的在位者,其从事的研发一般会围绕其现有的业务展开,并且需要的投入都相当高;而对于实力相对薄弱的竞争企业,其从事的研发则更多是“颠覆性”的,它的投入一般会较少,并且在技术路径上会区别于在位企业。当然,在现实中,情况可能更为复杂。例如,不少企业可能在一些市场上是垄断者,而在另一个市场上是竞争者。在这种情况下,它就可以利用在垄断市场上的利润来扶持竞争市场上的技术创新,这时它所从事的研发就可能既是具有颠覆性的,也是需要大资本投入的。
最后是创新对于企业的影响。这一点会直接影响到企业创新的激励和动机。如前所述,阿罗在分析市场结构对于创新的影响时,着重强调了“业务窃取效应”的影响,这个思路固然是正确的,但是,他并没有注意到现实中企业存在多业务的可能性。如果一个企业存在多个业务,并且在某个业务上是垄断者,而在其他市场上是竞争者,那么它就很可能为争夺在那些竞争市场上的主导权而大力创新。
在建立了以上框架之后,我们就可以利用这个框架来重新对谷歌在AI领域的创新问题进行进一步的分析。
谷歌同时在多个市场上具有业务。在搜索引擎市场上,它当然可以被称为是一个垄断者,而在AI产品以及其他市场上,它却只是一个竞争者。
那么,在谷歌占据优势的搜索市场上,影响市场结构的关键是什么呢?关于这个问题,我觉得最好的答案来自于美国众议院在2020年10月发布的《数字市场竞争状况调查报告》。根据这份报告,决定搜索市场结构的最根本力量其实来自于搜索技术本身。搜索引擎之所以能够为人们提供各种各样的信息,是由于它们对各种网站都安放了爬虫程序,因此当网站有任何更新时,这些爬虫就会将信息反馈给搜索引擎。但爬虫程序是会影响到网站运行效率的,所以网站通常会设置反爬程序。但是由于谷歌已经有了先发优势,在业内具有高知名度,所以网站会愿意被谷歌搜索到,会给它的爬虫网开一面,。给定以上情况,除非后续的竞争者能在极短时间内拥有超越谷歌的知名度,从而让网站都愿意被其爬取数据,否则它们在搜索内容的质量上就很难超越谷歌。正是这个原因,使得虽然搜索引擎市场上不断有新的竞争者,但谷歌却总能牢牢占据绝大部分的市场份额。
理解了这一点后,我们也就不难知道,在现有的情况下,谷歌其实并没有延缓某项技术(包括AI技术)的开发进度,以此来维护其搜索引擎市场的激励。事实上,关于这一点,我们可以从最近的信息当中得到佐证:在ChatG-PT大受成功之后,微软立刻将ChatG-PT集成到了必应搜索当中,推出了新必应。按照很多人的理解,这可能会对谷歌的优势造成巨大的冲击。但现实却是,在过去几个月中,谷歌在搜索市场的份额不降反升。也许有人会认为这是因为没有考虑到ChatGPT等大模型出现后,对于搜索引擎市场总量的影响。不过在我看来,至少在现在,这个因素依然是不重要的。根据大量第三方研究机构的数据,虽然ChatGPT确实在短期内获得了较高的浏览量,但这个浏览量大约只相当于谷歌浏览量的2%。从这个角度看,我们很难看出ChatGPT等大模型已经具有了取代搜索引擎的势头。
谷歌在其基本盘——搜索市场上是几乎垄断的,但在AI市场上却扮演着一个竞争者的角色。与此同时,由于搜索市场的技术特征,它几乎不用花太多心思来对这个市场进行防御,因此它就可以有更多的资源投入到AI等其他市场进行研发。此外,由于谷歌并没有和原业务相关的顾虑,所以在创新内容方面,它也不用面对太多的束缚框架。
综合这几方面,我们不难得出:谷歌在AI市场上是既有能力,又有意愿,并且还有灵活性和自主性的一个创新者。事实上,谷歌近些年在AI市场上的行为,比如研发Transformer并将其公开,以及支持DeepMind开发AlphaFold等产品,都很好地印证了这些推论。
错误的反垄断会把竞争市场反成垄断
通过以上的分析,我们可以看到,至少到目前为止,谷歌并没有出于维持自身在搜索市场上的统治地位的考虑而延缓AI发展。但这并不是说在未来的某个时间段,谷歌不会做出导致AI发展滞缓的行为。事实上,现在类似的苗头已经出现了:不久之前,谷歌对其研发人员做出要求,必须要在相关的产品已经正式面世之后才可以发表与产品相关的研究论文。很显然,在谷歌的新政出台后,其研发努力对于整个行业的外溢作用将会减少,竞争对手要想再搭谷歌的便车,“摸着谷歌过河”就难以再付诸实施。当然,如果只是这样,那么情况还在正常的竞争范围之内。但如果在AI市场上的竞争继续白热化,那么谷歌或许还会进一步升级自己的行动。例如,利用手中握有的Transformer等关键技术的专利,要求对手停止使用这一技术,或者要求它们为使用技术支付高昂的许可费。假如这种情况出现,那么AI行业就可能面临真正的困境。
不过,即使这种现象出现,它也只是涉及谷歌在AI领域市场上的市场力量,而和它在搜索、广告等市场上的地位没有直接的关系。从这个意义上讲,美国司法部试图用AI进步缓慢来论证其在搜索和广告这两个市场上对谷歌进行反垄断的合理性,是难以自圆其说的。当然,它宣称拆分广告业务可能促进AI发展的观点也是难以站得住脚的——如果法庭真的支持了司法部的请求,拆分了谷歌的广告业务,那么它的后果只会是完全破坏了谷歌搜索原本的双边市场商业模式,从而迫使其不得不改用直接收费等方法来盈利。这不仅会增加搜索市场的交易成本,还可能损害消费者的体验,并让整个搜索市场萎缩。
至于其对AI市场的影响,最大的可能是:它将导致谷歌可以投入到AI领域的资源大幅减少,从而让它在这一市场上的竞争力锐减。最终,这个原本竞争充分的市场可能会被微软和Ope-nAI的同盟一家独大。如果是这样,那么美国司法部就是用反垄断把一个竞争市场反成了垄断了。