7月18日,据百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜透露,文心一言大模型下一步的发展有以下两个方面,首先基础通用能力会持续提升;其次是持续建设实用化应用。
与此同时,吴甜分享了对人工智能时代下大模型技术的思考与百度文心一言的技术进展。
吴甜:大模型的终局会集中在少量几个
今年以来,国内掀起“百模大战”,针对这一现象,吴甜认为,在整体趋势方面,AI对产业影响越来越深,大模型可能会给整个产业结构,甚至是社会带来深刻的影响与变化,现在才刚刚拉开帷幕。
吴甜表示,大量新的模型出现是一个阶段性的现象,在演变的过程当中,各个企业和机构会逐渐找到自己的定位,走向各自的细分方向。
吴甜称,大模型的终局会集中在少量的几个,原因是:首先,真正从底层做起来的大模型成本非常高;其次,在应用层面未来想象空间非常大,依托少量大模型,会有非常广泛的应用生态。
人工智能时代,IT技术栈已发生根本性改变。传统的IT技术栈是三层,芯片层、操作系统层和应用层;在人工智能时代,操作系统层又细分为两层,深度学习框架和模型层。
同时,吴甜认为,大模型产业化面临着三方面挑战:首先是大模型的体积很大,模型大带来的训练难度高,成本高。第二,对于算力规模要求非常大,性能要求非常高。第三,数据规模也很大,收集、挖掘、建设、筛选、清洗这些数据,也是非常大的工程。
当前大模型产品技术、行业应用能力尤为重要
产品技术能力中,“算法模型”维度是重中之重,是大模型能力最为核心的要素,也是决定大模型应用效果的根本所在。算法模型技术的突破,以及具有通用效果的大模型底座,可以支撑更广泛的行业覆盖,推动各行各业享受技术突破带来的红利,也缓解AI落地门槛高的困境。
在行业应用能力中,应用覆盖的广度是当下大模型厂商最为关注的指标。“行业覆盖”通过企业级客户数量和落地行业数,体现了大模型在产业落地上的实力,是大模型效果通用领先性、行业结合能力两方面的综合体现。
“算法模型”、“行业覆盖”两个核心指标有其内在的关联性,行业覆盖的广度是算法模型通用领先性的集中体现,也将为算法模型能力提升提供正向反馈,形成持续迭代。
据IDC最新发布的《AI大模型技术能力评估报告,2023》显示,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一。
前不久,百度发布文心大模型3.5版本。百度称,其人工智能技术栈是“芯片-框架-模型-应用”四层架构布局,芯片层有昆仑芯,框架层有深度学习平台飞桨,模型层有文心大模型,还有应用层。
在大模型生态方面,百度文心已形成企业、教育、社区三位一体的生态体系。在应用层,据介绍,百度文心大模型在能源、金融、教育、医疗等领域已经实现业务布局和落地。
据介绍,文心大模型目前有15万家企业申请接入文心一言测试。