“我们不能只是关注 AI 应用本身,而是从一个全栈的角度,去全面审视应用、模型、数据、基础架构的安全规范、技术策略和平台工具。生成式AI应用就像是海面上的冰山,我们想要在企业里安全地驾驭这项新技术,还需要关注海面下的冰川。”
日前,以“AI时代 全面智能的安全”为主题的亚马逊云科技re:Inforce 2023中国站在北京举办,这也是re:Inforce首次登陆国内。人工智能的算力、算法、模型都离不开网络和云,在大语言模型、生成式AI持续升温的背景下,与AI相关的安全、合规等问题再次成为了行业关注的焦点。
随着基于大语言模型的应用开始进入生产力场景,模型如何与基础设施、安全等服务进行紧密集成,如何开发既安全又具备性价比的应用,也开始成为继大模型本身之后的核心话题。
据介绍,亚马逊云科技已经开始在国内同优秀的基础模型创业公司展开合作。明星企业百川智能加入了 APN 合作伙伴网络,并上架亚马逊云科技 Marketplace ,开始加速帮助企业客户对其开源模型的微调和部署,促进生成式 AI 在企业场景中的落地。
在主题演讲环节之后,亚马逊云科技大中华区解决方案架构部总监代闻、亚马逊云科技大中华区安全合规与治理产品总监白帆、亚马逊云科技大中华区技术专家团队总监王晓野一起向36氪等多家机构分享了生成式AI、大语言模型等前沿技术在云计算安全层面所带来的挑战及机遇。
亚马逊云科技大中华区解决方案架构部总监代闻
大语言模型和生成式AI能给传统的网络安全问题提供更具效率的全新解决方案,但也会衍生出此前并未系统性出现的新问题。近期,全球性安全组织OWASP列出了大语言模型应用所面临的十大威胁,比如当企业没有规定好数据边界、权限、应用的API控制,就有可能成为新的数据泄露途径。
目前,亚马逊云科技不仅提供了一系列的技术、服务和工具帮助更多企业充分释放生成式 AI 的潜力,同时确保安全合规是开展一切业务的基础,包括其生成式 AI的各种工具,涵盖数据、模型以及应用各个环节。
代闻表示:大语言模型的出现加速了零信任在企业中的落地,亚马逊云科技的零信任体系,它包括身份认证、可信网络、以及高颗粒度的权限管理以及审计。零信任和网络控制并不是一个二选一的关系,在亚马逊云科技看来,零信任能够实现按需的授权和认证,而网络控制依然是非常需要的,把这两个概念应该加起来,才能够实现企业的端到端的应用安全,尤其在大模型的时代中。
在网络世界里,威胁与防控措施始终此消彼长、互为矛盾。而现在,大语言模型和生成式AI既是矛、也是盾,如何因势利导、扬长避短,也将成为未来大语言模型、生成式AI大规模应用的焦点问题。
在IDC近期发布的《2023中国公有云托管安全服务能力报告》中,亚马逊云科技在专家能力、漏洞及威胁检测、威胁情报等7项目评估维度上是获得满分最多的厂商之一,其中“生态建设”评估维度是唯一获得满分的厂商。
借大语言模型之所长
与传统的机器学习方法相比,大模型依靠数量庞大的神经元和强大的计算能力,更强大、更灵活,能够有效地处理海量数据集和复杂的任务,这对于解决云上日益复杂的合规问题事半功倍,目前,云上合规环境的变化正呈现如下趋势:
大语言模型和生成式AI提供了横向能力,最终会把能力辐射到很多不同的工具中去,还有可能会产生新的工具,代闻认为:重点是如何用这些工具服务到广大用户,在这样的框架下,如何能使用最合适的、高效的工具来支撑,大量工具和解决方案能够从数据保护、隐私数据剔除、到运行环境来保障数据和模型的安全。
比如把AI能力提升到安全审计流程中去,这是一个循环往复的过程,AI为安全服务,安全反过来再为AI应用服务,这是一个以负责任的AI(Responsible AI)为基础框架,再使用合适的工具加以快速落地的过程。代闻强调:这个领域现在充满了未知,我们需要保持开放的心态和谨慎乐观,让生成式AI在企业服务中落地。
一方面,亚马逊云科技在全球获得140多个安全标准和合规认证,并将AI技术应用到其安全及合规服务中,能够为大规模批量审查提供安全控制,利用自动化减少手工操作以降低错误,利用AI提供一致性判断,利用AI/ML技术实现自动审查,全面提升合规效率。
据介绍,亚马逊云科技通过在其500多项自身合规审计控制项中使用AI技术,将审计时间节约了53%。
另一方面,亚马逊云科技通过APN合作伙伴网络提供数百种行业领先的安全解决方案,多层保护客户的应用和数据安全,携手构建1+1>2的安全合作。
在技术上包括网络安全、主机安全、应用安全、身份认证、威胁检测和事件分析、数据治理以及安全自动化运维等;咨询方面则提供方案建议、合规建议以及全面的安全咨询服务和合规服务。
来自数据、模型、应用的层层挑战
在人工智能时代,大语言模型承载着大量机构、企业,和每个人的隐私,而模型又与数据本身隔着多层神经网络,全栈安全则成为大模型自身迭代升级,再向应用层延伸所必须不断面对的问题。
白帆谈到:与传统业务相比,云上业务最大的区别是防守边界感不一样,当数据或业务迁移到云上时,首先概念上的改变是物理边界变成了逻辑边界,逻辑边界会使自身防护的略发生改变,以前只需保护看得见的地方,现在的重点是抽象化、看不见的地方。
数据安全
高质量数据是提升AI能力的关键,并且,大语言模型、生成式AI需要贯穿全周期的数据治理,从数据源的获取到数据的存储和查询,再到将数据传输给 AI平台进行模型的训练、调优和推理,以及全面实施数据分类和治理。
亚马逊云科技提供了一整套的解决方案、产品服务和最佳实践,帮助企业加速落地端到端的云原生数据战略,给生成式AI 提供高质量的数据支持:
与纷纷推出大语言模型的科技企业不同,亚马逊云科技所发布的Amazon Bedrock和多种生成式AI服务和功能,旨在帮助客户构建和扩展自己的生成式AI应用程序。Amazon Bedrock提供了广泛的基础模型因此客户可以选择最能满足需求的模型。
王晓野介绍说:Amazon Bedrock的定位不是会放非常多的模型,而是让用户有办法最容易地使用生成式AI领域最领先的模型,所以我们会挑行业内领先的模型,希望用户更容易地用到,所以是用API的方式来推出。我们通过API以及跟包括IAM和VPC等基于云所构建的环境,把基础设施上一系列最佳实践通过Amazon Bedrock以API的方式提供出来,让客户更好地使用。
Amazon Bedrock通过接入基础模型,提供API可以借助大模型加速生成式AI的应用程序和开发,无须管理底层的基础设施;并负责任地选取合作伙伴便于客户最快速地找到最合适的、能力最强的基础模型,例如AI21 Labs、Anthropic、Stability AI,最新的合作伙伴名单里增加了Cohere。
Amazon Bedrock使用组织内部的数据来训练大模型,同时给大模型做私有拷贝,这个拷贝只提供给客户服务,不会再与其他任何的大模型共享。此外,训练数据只是在客户账户里来帮助工作,不会拿任何用户的数据来增进自己的模型。这是很多企业在使用大模型时对于数据主权、数据保护方面的重要诉求。
同时,Amazon Bedrock全面使用亚马逊云科技的安全功能,如Amazon KMS、Amazon IAM等,在集成后可以全面管理加密、权限控制和所有行为的日志。
应用安全
对于每一个负责任的人工智能企业来说,安全应该贯穿到从开发到持续集成、持续部署再到投产、监控以及整个反馈的过程里面来。
王晓野谈到:把生成式AI应用到安全领域,最直接的方式是把应用的场景做好,比如Amazon CodeWisperer用于代码生成,以及近期发布的Amazon CodeGuru Security,亚马逊云科技把内部数据集训练出来的模型能力放到经过安全检测的应用场景中,通过三层能力提供给客户,全面支持不同层的客户用生成式AI。
在开发过程中,Amazon CodeWhisperer作为AI编程助手,根据开发者指令利用内嵌的基础模型实时生成代码建议,该服务内置了代码安全扫描功能,可帮助开发者查找难以检测的漏洞并提出补救建议;Amazon CodeGuru Security可以扫描代码,在代码里面寻找漏洞,包括调用包漏洞,包括很多其他代码逻辑的漏洞。
在应用运行中,企业可构建零信任的应用安全访问策略。这是一整套机制,需要对访问大模型的应用进行权限管理,确保只有在拥有特定权限的应用,才能访问或者调用大模型里的制定API。
亚马逊云科技推出系列工具,帮助客户构建零信任机制:
代闻指出:零信任和网络控制并不是一个二选一的关系,两者相加才能实现端到端的应用安全,尤其是在大模型时代。
针对网络防护,Amazon Shield用于防DDos攻击;Amazon WAF提供防火墙支撑;Amazon Firewall Manager可以轻松管制防火墙策略。据介绍,亚马逊云科技去年缓解了70万次DDos攻击,Amazon WAF上每天托管规则请求超过3500亿条。
针对威胁识别,Amazon GuardDuty使用了基于人工智能和机器学习的技术,使安全事件的误报率减少50%。它能够实现初期的检测,还可以做持续的分析,它会使用机器学习的技术来检测所有的威胁,以智能化的手段给予采取行动的建议。