经济观察网 记者 任晓宁
9月6日下午,百川智能在北京发布Baichuan 2系列开源大模型,这些模型可免费商用,百川智能创始人兼CEO王小川说,其开源模型已经全面超越了LLaMA2的性能。
LLaMA2发布于今年7月19日,由美国互联网大厂Meta推出,当时在全球引起轰动,外界评价说,LLaMA2的开源将可能影响大模型最终格局。
Baichuan 2开源大模型主要包括Baichuan2-7B和Baichuan2-13B,二者分别为70亿参数和130亿参数。王小川说,其70亿参数模型在英文评测级上,已经能够齐平LLaMA2的130亿参数模型,能够做到“以小博大”。
同为大模型创业者的澜舟科技创始人兼CEO周明也来到百川智能发布会,周明说,国外开源模型更多是支持英文为主的西方语言,对中文的支持要么不足,要么不太友好。他认为,Baichuan2两款模型,对中文用户的支持非常友好,而且它的性能在很多方面都超越了英文同等尺寸模型,因此是对中国大模型领域研究和应用的利好消息。
Baichuan 2大模型建立在上一代产品基础上,王小川解释说,跟第一代相比,新产品文科、理科能力均得到提升,此外,其代码能力、安全能力、逻辑、语义理解也有明显的提升。
百川智能上一代大模型开源后下载量超过500万次,有200多家企业申请试用百川开源模型,包括云厂商、科技制造公司、消费公司等。在百川智能列出的名单里,阿里云、蔚来汽车、美的集团都是合作伙伴。
百川智能成立于今年4月10日,4个月时间内已发布了3款大模型产品,也是国内首批通过《生成式人工智能服务管理暂行办法》备案的8家大模型公司之一。此次百川智能又快速推出了2代产品,王小川解释说,因为百川智能之前有搜索基因,因此天然懂得如何从万亿网页中间去精选最好的页面,可以做到去重、反垃圾。在数据处理中,百川智能也借鉴了之前搜索的经验,能小时级完成千亿数据的清洗和去重工作。