大模型掀起的技术狂热,终究要落于理性繁荣。
中国科技圈很久没有出现如此大规模的技术热潮了,这在4月11日的阿里云峰会体现得淋漓尽致,加之阿里巴巴CEO张勇的阿里云首秀,现场人头攒动,能容纳上千人的报告厅一度封闭,行业内外都想找到一些答案。
阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在云峰会上表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造。他认为,面向AI时代,所有产品都值得用大模型重新升级。
未来每一个企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。
阿里巴巴不是国内最先发布大模型的厂商,但关于怎么做好大模型,阿里云作为国内份额第一,且最早提出MaaS(Model as a Service)理念的云厂商,有一定的发言权。
阿里巴巴并没有太多着墨在大模型本身,而是将“云+AI”和盘托出。
张勇的阿里云首秀
这是张勇入主阿里云以来首次公开亮相,同样也是阿里巴巴分拆为六大业务集团,阿里云智能集团的首次亮相。钛媒体App了解到,阿里云大的组织变动基本清晰,涉及到各个产品团队之间的分拆、重组,尚在进行之中。
“不仅是判断,并且坚持,才让我们走到了今天”。在本次峰会上,张勇回顾了阿里云14年来的发展,始终把云计算视作未来的核心战略,阿里云抓住了移动互联网和产业互联网的两次机遇,阿里的超前预判和坚持投入,造就了今天的阿里云。
现在,到了张勇为阿里云做未来判断的时候,他笃定人工智能是云计算的未来。
“面向未来,因为人工智能技术全面的爆发和新一代技术的出现,可能对各行各业产生颠覆性的影响,让我们看到了数字化时代后,一个全新的智能化时代的到来。”他说。
张勇表示,数字化的时代还有先后之分,首先出现了一批新型的互联网公司,之后各行各业看到数字技术的力量,大家都争先恐后开始进行数字化的变革。
但在今天,在初步具备数字化普及程度和改造进程基础上,所有企业从阿里巴巴开始到所有的互联网公司,从最早的第一代互联网公司到最新的互联网公司,和所有经过改造以后各行各业的产业公司,面对智能化时代,大家站在同一个起跑线上。
“所有行业、所有应用、所有软件、所有服务,都值得基于新型人工智能技术、基于AIGC各方面技术支撑、大模型支撑重做一遍,这一定能带来不仅是一种创新性的客户体验、客户服务满足,同时也会让我们的生产范式、工作范式、生活范式发生很多变化。”张勇说道。
阿里巴巴决定未来将所有产品接入通义千问,进行全面改造。钉钉、天猫精灵等产品在接入通义千问测试后,变得更加智能化,像天猫精灵,能回答各种刁钻问题,钉钉接入通义千问测试之后,可以自动生成工作方案,也可以在会议纪要后自动生成总结和待办事项,还能拍一张功能草图自动生成小程序。
大模型是“云+AI”的全方位竞争
张勇指出,大模型是一场“AI+云计算”的全方位竞争,超万亿参数的大模型研发,并不仅仅是算法问题,而是囊括了底层庞大算力、网络、大数据、机器学习等诸多领域的复杂系统性工程,需要有超大规模AI基础设施的支撑。
阿里云是阿里大模型的出口,未来阿里云要做好两件事情:让算力更普惠,推动自研技术和规模化经营的正循环,持续释放技术红利;让AI更普及,让每家企业的产品都能接入大模型升级改造,并有能力打造自己的专属大模型。
具体来看,从算力普惠方面,阿里云推出新款通用算力型ECS云服务器Universal实例(简称U实例),售价相比上一代主售实例降幅最高可达40%,新发布的对象存储预留空间产品OSS-RC,费用可降低36%-70%。阿里云还推出“飞天免费试用计划”,开放50款云产品的免费试用。
从普及AI方面,阿里云从IaaS(Infrastructure as a Service)基础设施的服务,到基于大数据、机器学习平台的建设,大数据的平台服务PaaS(Platform as a Services),到(Model as a Service)MaaS模型即服务,形成了较为完善的大模型三重布局,以通用、标准化的服务输出给企业客户。
在IaaS方面,阿里云CTO周靖人表示,大模型训练离不开算力,今天模型的训练往往会以有多少张卡来表示背后的算力,其实这是一个非常简单的描述,所有GPU不是简简单单的堆砌,更需要的是让所有GPU,让异构算力能够联合起来为模型训练服务。
阿里云为AI训练场景打造了灵骏集群,规模上能够支持10万张卡GPU规模,通过800G全速无拥塞RDMA网络连接,存储方案能够做到每秒钟20TB带宽,还有多级缓存。
阿里云的机器学习平台PAI可以训练10万亿参数规模的大模型,同时也能让几千张甚至上万张卡联合一起训练超大规模的模型。
“因为我们一系列技术的创新、突破,能够支持万卡的单任务分布式训练规模,分布式加速比接近线性,能够有92%线性扩展效率,在一些训练场景上能够带来10x训练效率提升。”周靖人表示。
随着模型越来越复杂庞大,模型推理、模型服务的成本也是大家关心的焦点,为了做到有效模型的推理、服务,阿里云在模型的压缩方面做了大量工作,包括剪枝、蒸馏等一系列压缩手段,在不影响模型的情况下,把模型服务成本降低。一方面可以降低模型服务的延迟,一方面让模型服务的成本降低至八分之一。
“云智能”的兑现
人工智能对云计算的影响是巨大的,从业者可能有印象,2018年,阿里云升级为阿里云智能,一位时任阿里云高管对钛媒体App表示,当时大家都在思考,如何去驱动更大的云消费?
“静态的是存储、计算和网络,动态是数据库、大数据。还有就是AI、IoT,其中非常重要的是AI,会消耗大量的算力”。
云厂商的预期设想很好,但是不同于计算密集型负载,一个计算任务同时占用大量计算节点,很容易带动大量的云资源消耗,彼时大模型才初露端倪,人工智能和云的结合并不好,AI本身规模化价值的分散,使得“云智能”名不符实。
大模型改变了这一切,行业惊喜地发现,大模型几乎可以融入到一切产品和服务中,由大模型训练带来的算力消耗也许只是“前菜”,当大模型、行业模型足够普遍,每天无数次的推理才是云厂商期待的“主菜”。
就像过去的“互联网+”,现在都是“大模型+”,有多少大模型,背后就有多少云计算。
周靖人表示,去年阿里云在业内首次提出了“Model-as-a-service (MaaS,模型即服务),就是以云为基础,以模型为中心的概念,也看到有一些云计算友商不断地采用这个新概念,去设计它自身云的产品体系。
“所谓智能云的基础,就来自于智能的基础设施,要能够把大数据,把机器学习这方面的能力能够发挥到极致,智能云,其实是云的正常生命延展”。周靖人补充表示。
云厂商希望更多企业体验大模型,更希望让每家企业都能基于通用大模型,拥有具备自己行业能力的专属大模型,如此不仅能够带动大量的云资源消耗,也能产生长久的客户粘性,纯资源型留不住客户,一旦涉及到数据,客户往往就会谨慎迁移。
“如何对专属模型进行进一步成本的降低,有效的把解决行业问题所需要的那部分智能保留,这中间有非常多的技术的创新和技术的突破,这正是阿里云在这方面比较有优势的地方”,周靖人说。
阿里云不只发布了大模型,也是在展露出大模型背后的基础设施,技术狂热可以暂时忽略成本与收益,但大模型要真正实现理性繁荣,离不开工程化的实践,和现实的商业变现。
(本文首发钛媒体APP 作者|张帅 欢迎添加作者微信mr3right交流)