体育新闻
角逐云霸主:亚马(ma)逊云升(sheng)级自研(yan)AI芯片,与英伟达合作推AI基础办法(fa),科技,实例,Amazon
2023-11-30 23:19:21

·亚马(ma)逊云科技(AWS)成为第一家在云端配备英伟达GH200 Grace Hopper超级芯片的(de)云厂(chang)商,并(bing)将在其平台上推出英伟达DGX Cloud NVIDIA AI“锻炼即服务”。两家公(gong)司将合作推动Project Ceiba,构建全球(qiu)最快的(de)GPU驱动的(de)AI超级计算(suan)机。

·云计算(suan)领(ling)域正在履历一场激烈的(de)霸主争夺战,AWS和微软处(chu)于这场竞争的(de)最前沿,二者都在定制芯片高低了功夫,也都采(cai)取了某种“左右开弓(gong)”的(de)思绪:既推出自研(yan)芯片,也同时提供(gong)英伟达最新(xin)AI芯片这样的(de)可选项。

太平洋时间11月28日,亚马(ma)逊云科技在美国拉斯维加斯举行(xing)2023 re:Invent全球(qiu)大会。

太平洋时间11月28日,亚马(ma)逊云科技(Amazon Web service,AWS)在美国拉斯维加斯举行(xing)的(de)2023 re:Invent全球(qiu)大会上宣告,与英伟达扩大战略合作,将团结推出先辈的(de)基础办法(fa)、软件及服务,推动客户(hu)在生成式AI(Generative AI)的(de)创新(xin)。

AWS还宣告推出专为锻炼人工智能(neng)零碎而设计的(de)第二代芯片Trainium2,和通用Graviton4处(chu)置惩罚器。云计算(suan)领(ling)域正在履历一场激烈的(de)霸主争夺战,AWS和微软处(chu)于这场竞争的(de)最前沿,二者都在定制芯片高低了功夫,也都采(cai)取了某种“左右开弓(gong)”的(de)思绪。

首家在云端配备英伟达GH200

亚马(ma)逊云科技首席实行(xing)官(guan)亚当·塞利普斯基(Adam Selipsky)表示,“亚马(ma)逊云科技与英伟达合作已经超过(guo)13年,我们(men)的(de)合作起源于推出全球(qiu)首个(ge)设置GPU(图形处(chu)置惩罚器)的(de)云端实例。现(xian)在我们(men)推出最广泛的(de)英伟达GPU办理方案,可用于种种工作负载(zai),包括画图、游戏(xi)、HPC高功能(neng)计算(suan)、呆板学习,直到现(xian)在的(de)生成式AI。”

英伟达创始人兼首席实行(xing)官(guan)黄仁勋也衣着标(biao)记性皮衣出现(xian)在公(gong)布会现(xian)场,他在与塞利普斯基对话时说,“生成式AI正改变种种云端负载(zai),为多元(yuan)内容创作在底层注入加速计算(suan)动能(neng)。我们(men)的(de)共同目标(biao)是为每个(ge)客户(hu)提供(gong)具有成本效益的(de)先辈生成式AI,为此英伟达与亚马(ma)逊云科技在整个(ge)计算(suan)客栈展开合作,横跨AI基础办法(fa)、加速库(acceleration libraries)、基础模型和生成式AI服务。”

两边将英伟达与亚马(ma)逊云科技技能(neng)优势相结合,为锻炼基础模型和构建生成式AI应用提供(gong)理想(xiang)环境,具体包罗英伟达新(xin)一代GPU、CPU(地方处(chu)置惩罚器)与AI软件的(de)最新(xin)多节点零碎,和亚马(ma)逊云科技的(de)Nitro System先辈虚拟化与安(an)全平台、Elastic Fabric Adapter(EFA)互连技能(neng)和UltraCluster(超大规模集群)扩大能(neng)力。

亚马(ma)逊云科技与英伟达此次扩大合作首要包括四(si)个(ge)方面:

·亚马(ma)逊云科技成为第一家在云端配备英伟达GH200 Grace Hopper超级芯片的(de)云厂(chang)商。英伟达GH200 NVL32多节点平台为运用英伟达NVLink与NVSwitch技能(neng)连接32个(ge)Grace Hopper Superchips组成的(de)实例。此平台将在Amazon Elastic Compute Cloud(Amazon EC2)实例上可用,与亚马(ma)逊的(de)网络相连,由虚拟化(Amazon Nitro System)及超大规模集群(Amazon EC2 UltraClusters)提供(gong)支持,让(rang)共同客户(hu)能(neng)扩大至数千个(ge)GH200超级芯片。

·在亚马(ma)逊云科技平台大将推出英伟达DGX Cloud NVIDIA AI“锻炼即服务(AI-training-as-a-service)”。此服务将是首个(ge)设置GH200 NVL32的(de)DGX Cloud,为开发者提供(gong)单一实例中最多的(de)同享(xiang)内存。在亚马(ma)逊云科技上运行(xing)的(de)DGX Cloud将加速锻炼含有超过(guo)1兆参数的(de)尖端生成式AI与大型说话模型。

· 英伟达与亚马(ma)逊云科技合作推动Project Ceiba,构建全球(qiu)最快的(de)GPU驱动的(de)AI超级计算(suan)机,这是一个(ge)配备GH200 NVL32与Amazon EFA互连技能(neng)的(de)大规模零碎,该零碎安(an)排在亚马(ma)逊云科技上,为英伟达研(yan)发团队提供(gong)服务。该超级计算(suan)机将亘古(gu)未有地设置16384颗英伟达H200超级芯片,能(neng)处(chu)置惩罚65 exaflops(权衡超级计算(suan)机功能(neng)的(de)单位,每秒浮点运算(suan)可达一百亿亿次)速率品级的(de)AI运算(suan),英伟达使用该超级计算(suan)机推动其全新(xin)生成式AI的(de)创新(xin)。

· 亚马(ma)逊云科技将推出三款Amazon EC2实例:P5e实例设置英伟达H200 Tensor Core GPUs,针对大规模与尖端生成式AI及HPC高功能(neng)运算(suan)工作负载(zai);分别设置英伟达L4 GPUs与英伟达L40S GPUs的(de)G6与G6e实例,可运行(xing)包括AI微调、推理、画图和影(ying)片工作负载(zai)等广泛应用。G6e实例特别实用于开发3D工作流程、数字孪生、和其他使用英伟达Omniverse的(de)应用,用来贯穿连接与构建种种生成式AI的(de)3D应用。

据塞利普斯基透(tou)露,亚马(ma)逊云科技正运用英伟达NeMo框架锻炼新(xin)一代大说话模型Amazon Titan。Amazon Robotics也已开始借(jie)助英伟达Omniverse Isaac打造数字孪生,在虚拟化环境中推动自主仓库的(de)主动化、优化和计划,完成之后(hou)再安(an)排到真实环境。

最新(xin)自研(yan)芯片Trainium2和Graviton4

据塞利普斯基引见,Trainium2的(de)功能(neng)是其前身(2020年12月推出的(de)第一代Trainium)的(de)四(si)倍,能(neng)源服从是其前身的(de)两倍。10万个(ge)Trainium芯片可提供(gong)65 exaflops的(de)计算(suan)能(neng)力,相当于每个(ge)芯片可提供(gong)650 teraflops(每秒实行(xing)一万亿次浮点运算(suan))的(de)计算(suan)能(neng)力。

AWS表示,由10万个(ge)Trainium芯片组成的(de)集群能(neng)够在数周而没有是数月内锻炼出3000亿参数的(de)大说话模型,这大约是OpenAI的(de)大说话模型GPT-3大小的(de)1.75倍。

据AWS引见,始创公(gong)司Databricks和OpenAI竞争对手Anthropic计划使用新(xin)的(de)Trainium2芯片构建模型。但AWS没有透(tou)露AWS客户(hu)何时能(neng)够使用Trainium2实例,只是表述为“明年某个(ge)时间”。

亚马(ma)逊云科技计算(suan)和网络副总裁大卫·布朗(David Brown)表示,“芯片是用户(hu)所有工作负载(zai)的(de)基础……Graviton4是我们(men)在短短五年推出的(de)这一系列(lie)的(de)第四(si)代,是我们(men)至今功能(neng)最强大和最具能(neng)效的(de)芯片。”

AWS公(gong)布的(de)第二款芯片是基于Arm架构的(de)自研(yan)服务器CPU芯片Graviton4,旨(zhi)在用于推理。据塞利普斯基引见,与在Amazon EC2上运行(xing)的(de)上一代Graviton处(chu)置惩罚器Graviton3相比,Graviton4的(de)计算(suan)功能(neng)进步了30%,核心数量增加了50%,内存带宽增加了75%。

由Graviton4支持的(de)R8g实例已推出预览(lan)版,AWS客户(hu)目前已能(neng)够开始测试该处(chu)置惩罚器,该实例计划在将来几个(ge)月内周全上市。

云计算(suan)霸主的(de)“左右开弓(gong)”思绪

云计算(suan)领(ling)域正在履历一场激烈的(de)霸主争夺战,AWS和微软处(chu)于这场竞争的(de)最前沿,两家巨头都在定制芯片长进行(xing)了大量投(tou)资。

定制芯片素质上也是对当下(xia)生成式人工智能(neng)火热,大模型锻炼和运行(xing)所需GPU短缺的(de)应对。据巴伦周刊此前报道(dao),英伟达功能(neng)最好(hao)的(de)芯片的(de)交付已排到2024年。为了淘汰对GPU的(de)依赖,有能(neng)力包袱得起GPU的(de)公(gong)司正在开发定制芯片,用于创建、迭代和产品化大模型。

从微软和AWS两个(ge)云计算(suan)厂(chang)商能(neng)够窥察到一种“左右开弓(gong)”的(de)思绪:既推出自研(yan)芯片,也同时提供(gong)英伟达最新(xin)AI芯片这样的(de)可选项。此次亚马(ma)逊云科技在推出自己推理锻炼芯片的(de)同时,也提供(gong)对英伟达最新(xin)AI芯片H200的(de)接见。11月初,微软也采(cai)取了雷同的(de)思绪,推出了首款人工智能(neng)芯片Maia 100,并(bing)表示微软云(Azure)将配备英伟达H200 GPU。

除此之外,值得注重的(de)是,AWS也展示了其在量子(zi)计算(suan)领(ling)域的(de)一些最新(xin)希望,其中包括最新(xin)的(de)量子(zi)纠(jiu)错硬(ying)件设计,这类新(xin)的(de)架构无望用更(geng)少的(de)超导组件来产生可控的(de)逻辑量子(zi)比特,从而为超大规模量子(zi)计算(suan)机的(de)构建铺平道(dao)路。

公(gong)布于:上海市
 
    以上就是本篇文章的全部内容了,欢迎阅览 !
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 移动站 , 查看更多   
? ? ? ? ? ? ? ? ?