英特尔发布至强6+处理器:Intel 18A工艺,288个能效核,提升2.5倍性能
- +1 你赞过了
【天极网企业频道】6月1日,英特尔正式发布首款基于Intel 18A制程工艺的服务器处理器——至强6+(代号Clearwater Forest),以及全新以太网解决方案E835,并披露了面向智能体等诉求的下一代数据中心GPU(代号Crescent Island)。
至强6+:Intel 18A工艺、288颗能效核、大幅上涨内存带宽
近几年,数据中心除了传统负载外,AI负载的比重快速增长,预计到2030年AI与传统负载将各占50%。值得关注的是,随着智能体时代到来,越来越多的需求正在向推理侧迁移,推理与训练的差异也在改变着数据中心CPU与GPU的算力分配。以往海量的AI训练需求重点在于GPU支撑,数据中心的CPU与GPU算力配比约为1:4至1:8,而如今这一比例正向着1:1至1:2的方向变化。对于在市场中具有深厚渗透率的至强而言,围绕AI工作负载来打造产品、技术、软件栈等综合能力,将有助于抓住新趋势下的新机遇。
当然不只是AI,英特尔在分享中还提到,面对现代5G核心网与云原生等工作负载,算力基础设施也面临着新的挑战。行业当前有三大核心诉求:提升性能密度,在减少机架空间的同时处理更多的任务;提升每瓦性能,降低TCO;为关键业务部署提供高可靠性保障。
解决这些难题,英特尔至强6+可以发挥关键作用。先来看看至强6+的核心亮点。
至强6+拥有288颗能效核(与上一代Sierra Forest及AP型号相比,单路核心数量翻倍),性能较上代提升2.5倍,与同类产品相比每线程每瓦性能提升45%;末级缓存(LLC)达到576MB,是上代的5倍多;支持12通道DDR5内存,速率最高8000MT/s,内存带宽大幅提升;多达96条PCLe 5.0通道拓展,支持单路、双路平台配置,支持CXL;拥有包括英特尔软件防护扩展(SGX)和英特尔可信域扩展(TDX)等内置于芯片的可靠性机制,更好地支持机密和多租户部署需求,其新增密码学算法加速性能较上代提升15倍,领先竞品,打造坚实的可信计算底座。
还有一点很重要,至强6+符合现代化数据中心对于高密度基础设施的需求,从第二代至强升级至强6+,可实现高达9:1的服务器整合率,减少接近80%的数据中心物理空间占用,减少电力、散热等资源消耗,降低TCO。
在至强6+上,英特尔还带来了全新的英特尔应用能源遥测技术(AET),可实现实时、工作负载级的CPU能源和活动遥测,进而优化资源编排、精准成本分摊,有效提升工作负载级能耗的可见性。
全面提升也与至强6+采用的制程工艺和架构相关。凭借Foveros Direct 3D堆叠加EMIB 2D封装融合方案,至强6+将4颗基于Intel 18A制程工艺的计算模块堆叠于3颗Intel 3工艺基底模块之上,共12个计算模块,每个计算模块里集成了24核;I/O模块(基于Intel 7)则沿用至强6,通过EMIB 2D封装技术完成海量数据的高速互联,打造了高达288核的业内最高内核密度。
关于Intel 18A制程工艺,今年初正式发布的Panther Lake已经很好地展现了其在能效等方面带来的提升。作为首款基于Intel 18A的服务器处理器,至强6+也由此带来了性能提升和功耗降低,重点有两项关键创新:RibbonFET全环绕栅极晶体管以及PowerVia背部供电。
RibbonFET全环绕栅极晶体管采用了4条垂直堆叠的纳米带(Nano Ribbons)结构,让栅极能够从四面包电流通道完全环抱起来,可增强晶体管开关控制、响应速度,并显著抑制漏电,支持处理器降低待机功耗。同时,RibbonFET相比传统晶体管结构能够带来更好的可扩展性与设计灵活性,能够实现在同一个工艺平台上围绕高性能、低功耗等不同优化方向设计多种晶体管规格。
PowerVia背部供电的提升在于打造更短、更直接的供电路径,将以往位于晶圆正面的供电电路下沉到背面,在正面只保留信号互连部分,由此将标准单元利用率和晶体管密度提升可达10%,将压降(IR Drop)减少多达30%,将芯片运行效率最高提升6%。
不仅是芯片性能提升,至强6+还围绕网络基础设施、媒体业务、Web及微服务、存储等关键基础工作负载进行了优化。根据英特尔公布的测试成绩,至强6+在多类数据中心负载测试中,平均性能达到了上代的2.26倍,如智能体负载下至强6+性能领先超过了150%,通用计算领先也达到了129%;对比上代,至强6+每瓦性能最高也达到了上代的1.55倍。
与竞品相比(AMD EPYC 9965),至强6+每线程性能领先30%,每线程每瓦性能领先也达到了30%。
据英特尔透露,至强6+处理器已在电信网络基础设施中进行测试,并开始配置到数据中心系统中,整个生态系统均有可用平台。其中包括来自华硕、戴尔科技、爱立信、技嘉、慧与(HPE)、联想、超微等厂商所提供,或在其方案中采用的服务器、网络和集成解决方案。
另外,英特尔还提到了面向数据中心的下一代性能核(P-core)产品,将于2027年发布的Diamond Rapids。Diamond Rapids基于Intel 18A-P制程工艺,支持16通道,内存带宽将翻倍,并且核心数量将增加50%,提供更高的每线程性能,且支持更多PCIe Gen6通道。
以太网解决方案E835: 200Gbps带宽、能效比可达竞品1.9倍
算力资源在实际执行工作负载时能否被充分释放,还需要高性能、高能效的连接支持。为此,英特尔推出了以太网解决方案E835,拥有最高200GbE的数据速率、广泛的兼容性、10年以上生命周期。其更多核心亮点如下:
连接性:通过多种控制器和网络适配器配置,提供200 GbE的吞吐量,支持10GbE到200GbE的数据速率。E835支持广泛的端口配置,包括2x25GbE、4x25GbE、2x100GbE和1x200GbE,并可通过英特尔以太网端口配置工具(EPCT)启用更多配置。
能效:专为更高每瓦性能而设计。英特尔E835-CQDA2网络适配器的每瓦性能比同类产品高出多达1.4-1.9倍,从而降低了现代分布式环境的能耗和运营成本。
网络优化:采用RDMA (RoCEv2/iWARP),降低CPU占用率并最大化效率,支持动态设备个性化(DDP)以简化数据包处理流程,并提升应用性能。
可靠性与可管理性:集成硬件信任根(Root of Trust)和带签名的 SPDM,支持基于DMTF的可管理性,实现可靠、稳定的运营。
兼容性:支持包括Linux、ESXi和Windows在内的多种操作系统。
新一代数据中心GPU,代号Crescent Island
正如前文中提到的,AI智能体的快速发展在给AI的落地应用带来了更多机遇的同时,也给算力基础设施提出了更多的考验。不仅是CPU、GPU“职能”的变化——GPU负责进行推理、思考、代码生成和优化,CPU则负责编排、模拟、调度和执行,还有多步骤、多推力、多计算的智能体带给内存的压力,以及对Token的恐怖消耗。因此市场的需求并不只局限于某个“部分、环节”而是需要优化端到端的系统效率,进而获得更出色的性能与TCO。
对于英特尔而言,这也是个机会。面向AI智能体的需求,英特尔不仅提供广泛的加速器组合(集显、独显、数据中心GPU、SambaNova AI芯片),还有广泛的开放生态支持,覆盖开发、部署、落地的全面能力。其中,Xe GPU架构已经在数百万客户端中为端侧AI提升用户体验助力,而即将发布的Xe3P,拥有英特尔迄今为止最先进、性能最强的架构,对于AI运算也有更高效的支持。
本次英特尔透露的新一代数据中心GPU(代号Crescent Island)也将是首款基于Xe3P架构打造的产品,并专为“AI推理和智能体工作负载、适用于长上下文模型的大内存容量、高效率和更低的功耗、优化的TCO”进行了优化。
在规格方面,Crescent Island的TDP设定为350W(风冷PCIe设计,可在现有风冷数据中心部署);得益于LPDDR5x显存加持,可提供高达480GB的超大容量,在大幅降低TCO的同时,高效应对海量、词元密集型的工作负载;原生支持FP64在内的广泛数据类型,保证了灵活性。
英特尔表示,在软件方面将提供开箱即用的广泛模型软件支持,围绕开放、规模化性能、优秀的用户体验以及支持异构基础设施四个原则构建统一的Xe软件栈。同时英特尔将致力于至强处理器与GPU平台的支持合并到上游,来减少部署阻力。
目前已有超过20家OEM和ODM厂商、多个合作伙伴针对Crescent Island进行开发并准备发布。
写在最后
智能体的快速发展充分展现了市场对于可规模化部署AI应用的迫切需求。对于英特尔而言,这将是一场全方位的机遇,特别是有利于扩大在数据中心市场中的优势。
从英特尔至强6+到Crescent Island还能看到英特尔的发力点并不仅是为客户提供更高性能、更高能效的算力底座,还充分考虑了企业来自“成本”的焦虑,无论是更高的算力密度还是“开箱即用”的软件栈支持,都是在降低业务部署的门槛,提供更优的TCO。可以说,英特尔不仅持续丰富产品组合,也充分考虑到了AI、智能体以及传统负载的差异化需求,以更灵活、完善的“系统级”解决方案打造可靠、可信的算力底座,持续改进数据中心的整体运营效率。
最新资讯
热门视频
新品评测
X
微博认证登录
QQ账号登录
微信账号登录