亚马逊云科技宣布由英伟达H200 GPU提供支持的 Amazon Elastic Compute Cloud P5e(Amazon EC2 P5e)实例现已正式可用。亚马逊云科技是首个将英伟达H200 GPU用于生产环境的领先云提供商。与基于英伟达H100 GPU的Amazon EC2 P5实例相比,Amazon EC2 P5e实例GPU内存容量提升1.7倍,GPU内存宽带提升1.5倍。Amazon EC2 P5e非常适用于复杂的大型语言模型(LLM)和多模态基础模型(FM)的训练、微调和推理,用于支持最苛刻和计算密集型的生成式AI应用,如问答、代码生成、视频和图像生成、语音识别等。

Amazon EC2 P5e实例提供8个英伟达H200 GPU,具有1128GB高带宽GPU内存,同时提供第三代AMD EPYC处理器,2TB系统内存和30TB本地NVMe存储。Amazon EC2 P5e实例还提供 3,200 Gbps的聚合网络带宽并支持GPUDirectRDMA,从而能够绕过CPU进行节点间通信,实现更低的延迟和高效的横向扩展性能。Amazon EC2 P5e实例具有的更高的内存带宽、更大的GPU内存容量和对更大的batch sizes的支持,从而显著提升客户工作负载的性能、降低成本并简化运营。

Amazon EC2 P5e实例现已可通过Amazon EC2 Capacity Block for ML工具访问并在美国东部(俄亥俄州)区域正式可用。

此外,亚马逊云科技还宣布将推出Amazon EC2 P5en实例,通过将英伟达H200 GPU与定制的第四代英特尔Xeon可扩展处理器相结合支持PCle Gen5,将提供高达四倍的CPU和GPU之间的带宽,降低网络延迟,进一步提高工作负载性能。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2024-09-11 13:44:47
市场情报 曼孚科技完成数亿元B++轮融资,以大模型重构人工智能生产新范式
目前,曼孚科技旗下主要产品包括SEED数据标注平台、数据管理平台(含向量数据库)、AutoLabeling平台、模型训练平台以及大模型标注平台等。 <详情>
2024-09-09 18:04:02
市场情报 PingCAP 荣登 2024 Cloud 100 China 榜单第七
针对报名 Cloud 100 China 榜单企业的调研中,有 73% 的企业表示有出海计划,最热门的出海市场是东南亚市场。 <详情>
2024-08-30 17:06:33
2024-08-27 10:40:19
市场情报 一文揭秘:火山引擎云基础设施如何支撑大模型应用落地
未来火山引擎AI全栈云在算力、资源管理、性能及稳定性等方面还将继续探索。 <详情>
2024-08-23 17:50:23
市场情报 火山引擎谭待:没必要将AI和云对立,大模型是“云2.0”的组成部分
云市场的本质是规模经济,规模大意味着更强的竞争力、更好的弹性、更低的成本。 <详情>
上海市对2019年以来新建数据中心项目后评估 包括关键指标、功能定位等
2024-12-11 15:07:20
阿里云回应数据中心失火:切割施工产生高温铁渣导致,未造成人员伤亡和财产损失
2024-12-11 15:02:17
从全球布局到持续创新 Akamai如何获得中企出海的青睐
2024-12-11 15:00:57
12月19-20日,8000+算力产业代表齐聚北京,第十九届中国IDC产业年度大典即将正式启幕!
2024-12-11 11:57:02
议程揭晓丨12月20日算力技术创新与应用系列论坛
2024-12-09 15:47:29
采访普洛斯数据中心郭仁声:智算时代 我们需要怎样的算力与数据中心
2024-12-09 11:44:05
5040机架 内蒙古云著智算产业园项目一期封顶
2024-12-06 14:24:19
马斯克超级计算集群再升级:xAI扩大GPU规模至百万
2024-12-06 14:21:34
未来10年的智算中心应该怎么建?|12月20日北京,AI算力建设系列论坛将启
2024-12-06 11:44:36
亚马逊发布超级计算机集群和新型AI芯片服务器
2024-12-05 14:54:16
12月20日北京,聚焦区域算力生态|2024算力产业生态高质量发展大会
2024-12-05 11:27:14
以用户需求为核心,科华数据领航高端定制数据中心新赛道
2024-12-04 15:52:50
英特尔CEO突然宣布退休 数据中心芯片竞争力不足或是主因
2024-12-04 10:12:00
莲花控股终止与新华三6.93亿订单:已自持700台算力服务器
2024-12-04 10:06:00
头部算力企业将悉数亮相、大咖云集,完整议程重磅公布|12月19-20日,北京,第十九届中国IDC产业年度大典重磅启幕
2024-12-04 09:54:00