大模型B端混战:京东打产业牌切入竞争
(京东集团CEO许冉)
华夏时报(www.chinatimes.net.cn)记者 卢晓 北京报道
如同之前大热的元宇宙,最能体现科技潮流的大模型成为科技大厂今年以来纷纷发力的新方向。
最新公布大模型动向的是京东。继今年3月首度对外透露自家大模型进展后,7月13日,京东言犀大模型在2023京东全球科技探索者大会暨京东云峰会上对外亮相。京东CEO许冉当天还表示:“从产业切入大模型,这条路虽然难走,却如同从北坡攀登珠峰,有更波澜壮阔的风景,有巨大的探索价值。”
事实上,不只是京东,B端市场已经成为大模型们的兵家云集之地。现在千行百业都期待通过大模型来加速创新,降本增效,这无疑意味着一个巨大的市场。而考验大模型的,除了算力、数据,更重要的还是解决产业实际问题的能力。
大模型三步走
在如火如荼的大模型赛道里,京东的亮相并不算早。今年3月京东在发布去年全年财报时透露,京东云旗下言犀人工智能应用平台正筹备产业版ChatGPT,加速人工智能技术在产业落地。
京东集团技术委员会主席、京东云事业部总裁曹鹏也在7月13日的演讲中也提及,近几个月,一直有人问他京东怎么还不发大模型,“其实不是不发,京东2021年就构建了天琴超算集群开始训练大模型,2022年到百亿级。今年已经是千亿级模型,并且在世界大赛中取得了非常不错的成绩,只是我们认为,对话类的通用大模型不应该是全部,虽然现在这类产品很热,但大模型不应该只是拿来聊天写诗作画的玩具。”
曹鹏同时表示,人工智能与产业的结合,一直是京东技术探索的重点,“京东的大模型,一直在自有的零售、物流、健康、金融等场景中打磨。”
《华夏时报》记者从京东方面了解到,相较通用大模型,言犀大模型融合了70%通用数据与30%数智供应链原生数据,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。
京东也制定了大模型“三步走”的明确规划。目前,京东云已经基于内部实践构建了通用大模型;到今年年底这段时间,京东将经由高复杂场景大规模锤炼,迭代出扎实的产业服务;预计在2024年初,会将大模型能力向外部严肃商业场景开放。目前,京东已经走到第二步,已在零售、金融、物流、健康等领域,将大模型结合进自己业务流程。
曹鹏当天还举例称,通过言犀平台,行业用户不到一周时间,即可完成从数据准备、模型训练、到模型部署的全流程,之前需要10余人的科学家团队工作,现在只需要1—2个算法人员,通过平台模型加速工具优化,能节约90%的推理成本。
谁更懂产业
大模型的推出,也意味着服务对于京东的意义更重。事实上,京东对自己的定位是“以供应链为基础的技术与服务企业”,服务也成为拉动京东增长的重要引擎。
2023年第一季度,京东集团收入为2430亿元,同比增加1.4%。当期其服务收入为474亿元,同比增加34.5%。服务收入在京东大盘的比重也有所增加,今年一季度这一比例接近20%。2022全年这个数字则为17.3%。
不过此前百度、阿里、腾讯等科技大厂发布的大模型,也都希望能服务B端的行业市场,并已率先在自己内部业务中实践。
百度今年3月率先推出了文心一言大模型。百度CTO王海峰今年5月在中关村论坛期间还表示,未来各类应用将基于大模型来开发,每个行业需要打造行业自己的大模型,大模型将与实体经济深度融合,赋能千行百业。
阿里在今年4月也推出了自己的通义千问大模型。阿里云CTO周靖人在今年5月的中关村会议上也提出,Model as a service概念正在被广泛接受,模型会作为业务和开发系统开发的重要生产元素。
今年6月,腾讯云首次对外宣布打造行业模型商店,覆盖金融、文旅、政务等行业。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生当时还表示,产业场景是大模型最佳练兵场。
对于大模型扎堆B端市场,深度科技研究院院长张孝荣对《华夏时报》记者表示,通用大模型技术难度大,国内厂商的自研算法不成熟,用于训练模型的公开化的中文资料不完善,支持AI模型的算力成本巨大,加上难以满足监管标准和一系列社会伦理问题的要求,迟迟难以落地。“相比较而言,行业大模型削弱了这些技术难度,在特定的行业领域里,厂商可以逐步完善自研算法并提高算法精度,无需太高的算力成本也能满足模型训练需要,所以行业模型成了一个现实的选择。”
不过B端市场的激烈竞争,除了考验大模型的技术能力,还考验其解决行业问题的能力。有业内人士在跟记者交流时表示,行业大模型需要更有针对性的解决实际问题,容错率低,这都是通用大模型目前所不具备的。
京东也在7月13日提出一个公式:大模型的价值=算法×算力×数据×产业厚度的平方。许冉当天表示,前三个指标固然重要,但技术在产业场景落地应用,创造实际价值才是关键,“大模型真正实现自己的价值,一定是在产业应用中。”