经济观察网 记者 周应梅
7月13日,京东的大模型产品言犀在2023京东全球科技探索者大会暨京东云峰会首次公布。在发布会现场,京东并未重点展示大模型产品的通识问答能力,所有高管的主题演讲中提及最多的是“产业”二字,也未提及学习、追赶OpenAI等内容。
今年5月新上任的京东集团CEO许冉也到场发表了对大模型的看法,“虽然大模型具备智能涌现和泛化的能力,但是当它缺少产业数据的时候,对产业的理解存在非常大的局限性。”许冉说。她表示,京东不同于其他公司之处在于拥有深厚的产业数据积累。京东理解大模型的公式是:“大模型的价值=算法×算力×数据×产业厚度的平方”。
不过京东依然强调言犀大模型的训练数据70%来自通用领域,30%来自京东的产业数据,产业数据占比少。产业数据中来自零售、健康、金融、物流的分别13.6%、6.7%、3.9%、3.2%,并称既有通用大模型的“常识”,又具备产业模型的“专业”。
本次京东并未将言犀大模型作为一个具体平台发布,但京东称将会将这个能力开放,并发布了言犀AI开发计算平台,将于8月上线。这是一个提供大模型训练的平台,现场演示中,京东工作人员展示了五个步骤如何将通用大模型转化为行业健康大模型,其中包括创建目标、行业数据上传、创建管道、模型训练(可以选择目前已经开源的市面上的大模型)、部署和发布模型生成API。同时用户不需要上传数据,可以利用京东提供的数据。
京东方面称,一般这套流程,从数据准备、模型训练到模型部署,需要10余名科学家花费一周时间。但利用言犀AI开发计算平台,只需要1-2名算法人员,在数分钟就能完成,能节省90%的推理成本。
产品应用层面,基于京东的言犀大模型京东也推出了京医千询大模型和金融领域AI营销运营平台,分别可用于医疗问诊、营销活动策略生成等。
京东探索研究院院长何晓冬公布了京东大模型接下来的进度表,7月发布言犀大模型和言犀AI开发计算平台后,下半年大模型将应用于京东内部核心业务,2024年上半年将全面开放大模型能力。
(头图源:记者周应梅拍摄)