今年6月北京举行的安博会上 AI 产品展示(来源:钛媒体App编辑拍摄)
ChatGPT持续引发中国人工智能(AI)大模型赛道的投资热潮。
钛媒体App独家获悉,8月9日,生成式AI公司北京生数科技有限公司(简称“生数科技”)宣布完成数千万元天使+轮融资,本轮由锦秋基金投资,资金将主要用于算法研发、产品开发和团队扩充。
此前6月,生数科技宣布完成蚂蚁集团、BV百度风投、卓源资本近亿元的天使轮融资,首轮融资后估值1亿美金。而仅过去不到两个月,生数科技又一次连续完成第二轮投资。(详见钛媒体App前文:《蚂蚁、百度联合投资AIGC赛道,生数科技首轮融资后估值1亿美金》)
生数科技CEO唐家渝对钛媒体App表示,公司正计划打造百亿级参数量的大模型。相较于其他团队,生数的核心壁垒在于多模态大模型架构的原创先进性、持续的底层算法创新能力等,团队已研发出开源大模型Unidiffuser。
“目前在文生图场景中,我们的效果已经达到了Stable Diffusion最新版基础模型效果,但与Midjourney相比还有一定差距,主要是美学性方面,我们预计年底会达到Midjourney最新版的效果。”唐家渝表示。
据悉,生数科技成立于2023年3月,是全球领先的生成式 AI 基础设施及应用提供商,由清华系 AI 公司瑞莱智慧RealAI、蚂蚁集团和百度发起的BV百度风投联合孵化成立,致力于打造可控多模态通用大模型。唐家渝此前曾任瑞莱智慧副总裁。
产品方面,今年3月,生数科技团队已发布9.5亿参数的开源多模态大模型Unidiffuser,采用基于Transformer架构的底层统一网络框架U-ViT,实现图文模态之间的任意跨模态生成。
唐家渝告诉钛媒体App,目前,业界主要集中在解决两大核心问题:一是让模型能理解和对齐多种模态的数据;二是使模型能生成各种模态的内容。大多数方法仍然依赖于组合多个模型来处理多模态数据,但Unidiffuser利用U-ViT架构,成功地将文本和图像整合到一个框架中,而且其闭源版本还进一步整合了3D和视频内容。
目前,生数科技团队的研发核心主要有两方面:一是在Unidiffuser核心架构设计的基础上自主研发更高参数量的产业级大模型,在文本、图像的基础上融入3D、视频等更多模态数据,现阶段已实现百亿数据、数十亿参数规模的通用大模型内测,支持文图生成、3D生成和视频元素编辑等功能;二是基于底层通用模型能力,研发面向图像创作、3D资产创建等内容创作场景打造“AI工具集”,产品将于今年底前推出。
商业化方面,唐家渝向钛媒体App透露,生数科技商业化路径分两部分:一方面是开发面向终端用户的应用,例如图像创作助理、3D资产生成平台,以订阅等形式收费;另一方面,面向B端机构,提供调用模型服务。
“我们希望帮助个人用户解决细分场景下的图像创作需求,同时能实现高质量效果。目前,我们一款内测的产品就是定位个人图像创作助理,围绕更通用底层的图像创造和编辑需求,真正做到言出法随,让用户用特别简单的指令和交互就能创造出理想的图像。难点涉及到底层模型可控生成方面的技术突破,以及对于普通用户在图像创作和编辑需求意图方面的深刻理解。”唐家渝表示。
唐家渝认为,相比语言类大模型,在多模态大模型方向,国内与国外的研究都处于早期探索阶段,并没有形成明显的差距,均面临包括架构层面解决多模态数据对齐、模态的统一和通用,以及大模型指令微调等问题,目前全球都还处于早期的技术研究和验证阶段,所以国内外差距不明显。而且在某些工作方向,国内已经领先于国外。
值得注意的是,生数科技此轮投资方“锦秋基金”与字节跳动关系密切。该基金成立于2022年3月,由原字节跳动财务投资负责人杨洁Janna创立,创始成员多数来自于原字节跳动投资团队以及国内顶级风险投资机构和知名产业公司,专注于早期和成长期投资。早前,杨洁还曾供职于红杉资本、深创投、同创伟业等。
目前,锦秋基金主要聚焦AI和出海领域,已投资海外电商服务平台Jet Commerce等,并且杨洁在未来机器人、鲨鱼菲特、零犀科技等多家企业有任职。
针对此次融资,锦秋基金投资副总裁郑晓超表示,大模型和生成式AI正引领当前最大的一波科技新浪潮,催生了全新的生产力工具和应用产品的出现,但其核心驱动力仍来自于底层模型的创新。生数科技团队不仅聚焦底层技术创新,拥有深度生成式模型的骨干网络、高速采样、可控生成等全栈研发能力,具备从0到1训练全球最大扩散模型的深厚技术实力。同时在商业化产品探索层面,生数科技团队也具有极强的工程化能力和产品创新能力。
唐家渝表示,生成式AI技术将让每个人都能更好地进行表达和创造,当想象力不再被局限,生产效率将大幅提升,传统的生产关系和人机交互模式也将得以重塑。未来生数科技将持续打磨通用大模型和应用产品,致力于通过不断解放想象力进而提升全人类的创造力和生产力。(本文首发钛媒体App,作者|林志佳)