角逐云霸主：亚马(ma)逊云升(sheng)级自研(yan)AI芯片，与英伟达合作推AI基础办法(fa),科技,实例,Amazon-体育新闻-律师

角逐云霸主：亚马(ma)逊云升(sheng)级自研(yan)AI芯片，与英伟达合作推AI基础办法(fa),科技,实例,Amazon

2023-11-30 23:19:21

·亚马(ma)逊云科技（AWS）成为第一家在云端配备英伟达GH200 Grace Hopper超级芯片的(de)云厂(chang)商，并(bing)将在其平台上推出英伟达DGX Cloud NVIDIA AI“锻炼即服务”。两家公(gong)司将合作推动Project Ceiba，构建全球(qiu)最快的(de)GPU驱动的(de)AI超级计算(suan)机。

·云计算(suan)领(ling)域正在履历一场激烈的(de)霸主争夺战，AWS和微软处(chu)于这场竞争的(de)最前沿，二者都在定制芯片高低了功夫，也都采(cai)取了某种“左右开弓(gong)”的(de)思绪：既推出自研(yan)芯片，也同时提供(gong)英伟达最新(xin)AI芯片这样的(de)可选项。

太平洋时间11月28日，亚马(ma)逊云科技在美国拉斯维加斯举行(xing)2023 re:Invent全球(qiu)大会。

太平洋时间11月28日，亚马(ma)逊云科技（Amazon Web service，AWS）在美国拉斯维加斯举行(xing)的(de)2023 re:Invent全球(qiu)大会上宣告，与英伟达扩大战略合作，将团结推出先辈的(de)基础办法(fa)、软件及服务，推动客户(hu)在生成式AI（Generative AI）的(de)创新(xin)。

AWS还宣告推出专为锻炼人工智能(neng)零碎而设计的(de)第二代芯片Trainium2，和通用Graviton4处(chu)置惩罚器。云计算(suan)领(ling)域正在履历一场激烈的(de)霸主争夺战，AWS和微软处(chu)于这场竞争的(de)最前沿，二者都在定制芯片高低了功夫，也都采(cai)取了某种“左右开弓(gong)”的(de)思绪。

首家在云端配备英伟达GH200

亚马(ma)逊云科技首席实行(xing)官(guan)亚当·塞利普斯基（Adam Selipsky）表示，“亚马(ma)逊云科技与英伟达合作已经超过(guo)13年，我们(men)的(de)合作起源于推出全球(qiu)首个(ge)设置GPU（图形处(chu)置惩罚器）的(de)云端实例。现(xian)在我们(men)推出最广泛的(de)英伟达GPU办理方案，可用于种种工作负载(zai)，包括画图、游戏(xi)、HPC高功能(neng)计算(suan)、呆板学习，直到现(xian)在的(de)生成式AI。”

英伟达创始人兼首席实行(xing)官(guan)黄仁勋也衣着标(biao)记性皮衣出现(xian)在公(gong)布会现(xian)场，他在与塞利普斯基对话时说，“生成式AI正改变种种云端负载(zai)，为多元(yuan)内容创作在底层注入加速计算(suan)动能(neng)。我们(men)的(de)共同目标(biao)是为每个(ge)客户(hu)提供(gong)具有成本效益的(de)先辈生成式AI，为此英伟达与亚马(ma)逊云科技在整个(ge)计算(suan)客栈展开合作，横跨AI基础办法(fa)、加速库（acceleration libraries）、基础模型和生成式AI服务。”

两边将英伟达与亚马(ma)逊云科技技能(neng)优势相结合，为锻炼基础模型和构建生成式AI应用提供(gong)理想(xiang)环境，具体包罗英伟达新(xin)一代GPU、CPU（地方处(chu)置惩罚器）与AI软件的(de)最新(xin)多节点零碎，和亚马(ma)逊云科技的(de)Nitro System先辈虚拟化与安(an)全平台、Elastic Fabric Adapter（EFA）互连技能(neng)和UltraCluster（超大规模集群）扩大能(neng)力。

亚马(ma)逊云科技与英伟达此次扩大合作首要包括四(si)个(ge)方面：

·亚马(ma)逊云科技成为第一家在云端配备英伟达GH200 Grace Hopper超级芯片的(de)云厂(chang)商。英伟达GH200 NVL32多节点平台为运用英伟达NVLink与NVSwitch技能(neng)连接32个(ge)Grace Hopper Superchips组成的(de)实例。此平台将在Amazon Elastic Compute Cloud（Amazon EC2）实例上可用，与亚马(ma)逊的(de)网络相连，由虚拟化（Amazon Nitro System）及超大规模集群（Amazon EC2 UltraClusters）提供(gong)支持，让(rang)共同客户(hu)能(neng)扩大至数千个(ge)GH200超级芯片。

·在亚马(ma)逊云科技平台大将推出英伟达DGX Cloud NVIDIA AI“锻炼即服务（AI-training-as-a-service）”。此服务将是首个(ge)设置GH200 NVL32的(de)DGX Cloud，为开发者提供(gong)单一实例中最多的(de)同享(xiang)内存。在亚马(ma)逊云科技上运行(xing)的(de)DGX Cloud将加速锻炼含有超过(guo)1兆参数的(de)尖端生成式AI与大型说话模型。

· 英伟达与亚马(ma)逊云科技合作推动Project Ceiba，构建全球(qiu)最快的(de)GPU驱动的(de)AI超级计算(suan)机，这是一个(ge)配备GH200 NVL32与Amazon EFA互连技能(neng)的(de)大规模零碎，该零碎安(an)排在亚马(ma)逊云科技上，为英伟达研(yan)发团队提供(gong)服务。该超级计算(suan)机将亘古(gu)未有地设置16384颗英伟达H200超级芯片，能(neng)处(chu)置惩罚65 exaflops（权衡超级计算(suan)机功能(neng)的(de)单位,每秒浮点运算(suan)可达一百亿亿次）速率品级的(de)AI运算(suan)，英伟达使用该超级计算(suan)机推动其全新(xin)生成式AI的(de)创新(xin)。

· 亚马(ma)逊云科技将推出三款Amazon EC2实例：P5e实例设置英伟达H200 Tensor Core GPUs，针对大规模与尖端生成式AI及HPC高功能(neng)运算(suan)工作负载(zai)；分别设置英伟达L4 GPUs与英伟达L40S GPUs的(de)G6与G6e实例，可运行(xing)包括AI微调、推理、画图和影(ying)片工作负载(zai)等广泛应用。G6e实例特别实用于开发3D工作流程、数字孪生、和其他使用英伟达Omniverse的(de)应用，用来贯穿连接与构建种种生成式AI的(de)3D应用。

据塞利普斯基透(tou)露，亚马(ma)逊云科技正运用英伟达NeMo框架锻炼新(xin)一代大说话模型Amazon Titan。Amazon Robotics也已开始借(jie)助英伟达Omniverse Isaac打造数字孪生，在虚拟化环境中推动自主仓库的(de)主动化、优化和计划，完成之后(hou)再安(an)排到真实环境。

最新(xin)自研(yan)芯片Trainium2和Graviton4

据塞利普斯基引见，Trainium2的(de)功能(neng)是其前身（2020年12月推出的(de)第一代Trainium）的(de)四(si)倍，能(neng)源服从是其前身的(de)两倍。10万个(ge)Trainium芯片可提供(gong)65 exaflops的(de)计算(suan)能(neng)力，相当于每个(ge)芯片可提供(gong)650 teraflops（每秒实行(xing)一万亿次浮点运算(suan)）的(de)计算(suan)能(neng)力。

AWS表示，由10万个(ge)Trainium芯片组成的(de)集群能(neng)够在数周而没有是数月内锻炼出3000亿参数的(de)大说话模型，这大约是OpenAI的(de)大说话模型GPT-3大小的(de)1.75倍。

据AWS引见，始创公(gong)司Databricks和OpenAI竞争对手Anthropic计划使用新(xin)的(de)Trainium2芯片构建模型。但AWS没有透(tou)露AWS客户(hu)何时能(neng)够使用Trainium2实例，只是表述为“明年某个(ge)时间”。

亚马(ma)逊云科技计算(suan)和网络副总裁大卫·布朗（David Brown）表示，“芯片是用户(hu)所有工作负载(zai)的(de)基础……Graviton4是我们(men)在短短五年推出的(de)这一系列(lie)的(de)第四(si)代，是我们(men)至今功能(neng)最强大和最具能(neng)效的(de)芯片。”

AWS公(gong)布的(de)第二款芯片是基于Arm架构的(de)自研(yan)服务器CPU芯片Graviton4，旨(zhi)在用于推理。据塞利普斯基引见，与在Amazon EC2上运行(xing)的(de)上一代Graviton处(chu)置惩罚器Graviton3相比，Graviton4的(de)计算(suan)功能(neng)进步了30%，核心数量增加了50%，内存带宽增加了75%。

由Graviton4支持的(de)R8g实例已推出预览(lan)版，AWS客户(hu)目前已能(neng)够开始测试该处(chu)置惩罚器，该实例计划在将来几个(ge)月内周全上市。

云计算(suan)霸主的(de)“左右开弓(gong)”思绪

云计算(suan)领(ling)域正在履历一场激烈的(de)霸主争夺战，AWS和微软处(chu)于这场竞争的(de)最前沿，两家巨头都在定制芯片长进行(xing)了大量投(tou)资。

定制芯片素质上也是对当下(xia)生成式人工智能(neng)火热，大模型锻炼和运行(xing)所需GPU短缺的(de)应对。据巴伦周刊此前报道(dao)，英伟达功能(neng)最好(hao)的(de)芯片的(de)交付已排到2024年。为了淘汰对GPU的(de)依赖，有能(neng)力包袱得起GPU的(de)公(gong)司正在开发定制芯片，用于创建、迭代和产品化大模型。

从微软和AWS两个(ge)云计算(suan)厂(chang)商能(neng)够窥察到一种“左右开弓(gong)”的(de)思绪：既推出自研(yan)芯片，也同时提供(gong)英伟达最新(xin)AI芯片这样的(de)可选项。此次亚马(ma)逊云科技在推出自己推理锻炼芯片的(de)同时，也提供(gong)对英伟达最新(xin)AI芯片H200的(de)接见。11月初，微软也采(cai)取了雷同的(de)思绪，推出了首款人工智能(neng)芯片Maia 100，并(bing)表示微软云（Azure）将配备英伟达H200 GPU。

除此之外，值得注重的(de)是，AWS也展示了其在量子(zi)计算(suan)领(ling)域的(de)一些最新(xin)希望，其中包括最新(xin)的(de)量子(zi)纠(jiu)错硬(ying)件设计，这类新(xin)的(de)架构无望用更(geng)少的(de)超导组件来产生可控的(de)逻辑量子(zi)比特，从而为超大规模量子(zi)计算(suan)机的(de)构建铺平道(dao)路。

公(gong)布于：上海市

以上就是本篇文章的全部内容了，欢迎阅览！
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页移动站 , 查看更多