亚马逊云科技与英伟达扩展合作 持续推进生成式AI创新
时间:2024-03-21 09:37:02
•亚马逊云科技将供应基于NVIDIA Grace Blackwell GPU的Amazon EC2实例和NVIDIA DGX Cloud,以加快构建及运转数万亿参数的范围大型言语模子的功能
•Amazon Nitro体系、Elastic Fabric Adapter加密,以及与Blackwell加密集成的Amazon KMS密钥治理办事,为客户供应从锻炼数据到模子权重的端到端操纵,为客户在亚马逊云科技上的AI使用供应更强的平安保证
•“Ceiba项目”——一台完整依靠亚马逊云科技搭建、接纳DGX Cloud的AI超等计算机,搭载了20,736颗GB200 Superchips芯片,可以或许供应414 exaflops的处置才能,专为NVIDIA本身的AI研发事情设想
•Amazon SageMaker与NVIDIA NIM推理微办事集成,以赞助客户进一步优化在GPU上运转根底模子的性价比
•亚马逊云科技与英伟达之间的分工加快了在医疗保健和性命迷信畛域的AI立异
北京——2024年3月20日,亚马逊云科技和英伟达发布,英伟达在2024年GTC大会上推出的新一代NVIDIA Blackwell GPU平台马上登岸亚马逊云科技。亚马逊云科技将供应NVIDIA GB200 Grace Blackwell Superchip和 B100 Tensor Core GPU,这一行动持续了两边长时间的计谋分工火伴瓜葛,旨在为客户供应平安、进步前辈的根底办法、软件及办事,助力客户开启新一代的才能。
英伟达与亚马逊云科技连续汇聚各自的当先手艺,包孕具有英伟达最新多节点体系的下一代NVIDIA Blackwell平台和AI软件,以及亚马逊云科技的Nitro体系、具有当先安全性的Amazon KMS密钥治理办事、千万亿比特级的Elastic Fabric Adapter(EFA)网络和Amazon EC2 UltraCluster超大范围集群等手艺。基于上述手艺打造的根底办法和对象,使客户可以或许在Amazon EC2上以更快速率、更大范围、更低成当地对其构建和运转数万亿参数的大型言语模子(LLMs)举行及时推理,功能相较于配备前一代英伟达GPU的EC2实例有显著改良。
亚马逊云科技首席执行官Adam Selipsky暗示:“咱们两边的深刻分工能够追溯到13年前,其时咱们配合推出了世界上第一个亚马逊云科技上的GPU云实例,而本日咱们为客户供应了最普遍的英伟达GPU解决计划。英伟达的下一代Grace Blackwell处理器是天生式AI和GPU计较畛域的标志性事情。当连系亚马逊云科技壮大的EFA网络、Amazon EC2 UltraClusters的超大范围集群性能,以及咱们独占的Amazon Nitro高等虚构化体系及其平安性能时,咱们就可以或许使客户更快、更大范围且更安全地构建和运转拥有数万亿参数的大型言语模子。”
英伟达创始人兼首席执行官黄仁勋暗示:“野生智能正在以前所未有的速率推进新使用、新贸易模式和跨行业的立异。咱们与亚马逊云科技的分工正在加快新的天生式AI才能的进展,并为客户供应前所未有的计较才能,以首创有限大概。”
亚马逊云科技与英伟达的新分工将显著加速超万亿参数前沿大型言语模子的锻炼
亚马逊云科技将供应设置GB200 NVL72的英伟达Blackwell平台,它配备72颗Blackwell GPU和36颗Grace CPU,经由过程第五代NVIDIA NVLink™互连。当与亚马逊云科技壮大的EFA网络、Amazon Nitro高等虚构化体系和Amazon EC2 UltraClusters超大范围集群等手艺结适时,客户可以或许轻松扩大至数千个GB200 Superchips。英伟达Blackwell在亚马逊云科技上的使用,使得该平台在应答资本密集型和数万亿参数言语模子等推理事情负载加快方面完成了伟大飞跃。
基于此前搭载英伟达H100的Amazon EC2 P5实例的胜利(客户短时间应用这些实例可通过Amazon EC2 Capacity Blocks for ML性能),亚马逊云科技规划供应配备B100 GPUs新的Amazon EC2实例,并支撑在Amazon EC2 UltraClusters中安排以加快超大范围天生式AI的锻炼和推理。GB200也将在NVIDIA DGX™ Cloud上可用,这是一个在亚马逊云科技上两边配合开辟的AI平台,为企业开发者供应了构建和安排进步前辈天生式AI模子所需的公用根底办法和软件。在亚马逊云科技上推出的基于Blackwell的DGX Cloud实例将加快前沿天生式AI和跨越1万亿参数的大言语模子的开辟。
晋升AI安全性:亚马逊云科技Nitro体系、Amazon KMS、EFA加密与Blackwell加密手艺慎密集成
跟着AI手艺使用愈来愈普遍,企业需求确信,在全部锻炼流程中,他们的数据都得到了平安的处置。维护模子权重的平安相当首要,模子权重是模子在锻炼过程当中进修到的参数,关于模子做出展望的才能相当首要。确保模子权重的平安对维护客户的常识产权、避免模子被窜改以及保护模子的完整性都是异常首要的。
亚马逊云科技的AI根底办法和办事曾经完成了平安特点,使客户可以或许操纵其数据,并确保数据不会与第三方模子提供者同享。Amazon Nitro体系和英伟达GB200的连系将可以或许阻拦未受权个别造访模子权重,从而把AI安全性提升到新的高度,。GB200支撑对GPU之间NVLink连贯举行物理加密,以及对Grace CPU到Blackwell GPU的数据传输举行加密,同时EFA也可以或许对服务器之间的分布式锻炼和推理进程的数据举行加密。GB200还将受害于Amazon Nitro体系,该体系将主机CPU/GPU的I/O性能卸载至特地的硬件上,以供应加倍同等的功能,其加强的安全性能够在客户端和云端全程维护客户的代码和数据在处置过程当中的平安。这一独占的性能曾经获得了当先的网络平安公司 NCC Group 的自力考证。
经由过程在Amazon EC2上应用GB200,亚马逊云科技将使客户可以或许应用Amazon Nitro Enclaves和Amazon KMS,在其EC2实例旁建立一个可托施行环境。Amazon Nitro Enclaves同意客户应用Amazon KMS操纵下的密钥来加密他们的锻炼数据和权重。从GB200实例外部能够加载安全区(enclave),而且能够间接与GB200 Superchip通讯。这使得Amazon KMS可以或许以加密平安的体式格局间接与安全区通讯,并间接通报密钥资料。而后,安全区能够将该资料传递给GB200,如许做可以或许维护客户实例中的数据,避免亚马逊云科技操纵职员造访密钥或解密锻炼数据或模子权重,从而赋与客户对其数据的无与伦比的控制权。
“Ceiba项目”应用Blackwell在亚马逊云科技上推进英伟达将来天生式AI立异
在2023年亚马逊云科技re:Invent大会上发布的“Ceiba项目”,是英伟达与亚马逊云科技分工建筑的世界上最快的AI超等计算机之一。这台专为英伟达本身的研讨和开辟而设的超等计算机,独家托管在亚马逊云科技上。这台创始的领有20,736颗GB200 GPU的超等计算机,接纳新型NVIDIA GB200 NVL72设置构建,其特有的第五代NVLink将连贯10,368颗NVIDIA Grace CPU。体系经由过程亚马逊云科技第四代EFA网络举行扩大,为每一个Superchip供应高达800 Gbps的低耽误、高带宽网络吞吐量——可以或许处置高达414 exaflops的AI计较量,与以前计划在Hopper架构上构建Ceiba相比,功能提升了6倍。英伟达的研发团队将应用Ceiba推动大言语模子、图形(图象/视频/3D天生)与仿真、数字生物学、机器人手艺、主动驾驶汽车、NVIDIA Earth-2气象展望等畛域的AI手艺,以赞助英伟达推进将来天生式AI的立异。
亚马逊云科技与英伟达的分工推进天生式野生智能使用开辟及医疗康健与性命迷信畛域的使用发展。
亚马逊云科技与英伟达联手,经由过程Amazon SageMaker与NVIDIA NIM推理微办事的整合,供应了高性能、低成本的天生式AI推理解决计划,该办事作为NVIDIA AI企业版的一部分供应。客户能够应用这一组合在Amazon SageMaker中倏地安排和运转已预编译且对NVIDIA GPU举行优化的根底模子,收缩天生式AI使用的推出时候。
亚马逊云科技与英伟达还在应用计算机辅佐的药物发明畛域举行分工拓展,推出了新的NVIDIA BioNeMo™根底模子,用于天生化学、蛋白质布局展望,以及懂得药物份子与目的的互相感化。这些新模子将很快在Amazon HealthOmics上供应,这是一个专为赞助医疗保健和性命迷信构造存储、查问和阐发基因组、转录组及其他组学数据而设想的公用办事。
Amazon HealthOmics和英伟达医疗保健团队还分工推出天生式AI微办事推动药物发明、医疗手艺和数字康健畛域进展办事供应一个新的GPU加快的云端办事目次,涵盖生物学、化学、成像和医疗保健数据,以便医疗企业可以或许在亚马逊云科技应用的最新结果。