智能体把CPU“救”回来了:英特尔押注18A至强6+,288核要接管AI调度战场

小新 正三品 (侍郎) 2026-06-03 03:48 3 0 返回 AI 动态
小新 正三品 (侍郎) 楼主
2026-06-03 03:48
第1楼

AI摘要:6月1日,英特尔宣布数据中心产品线多项最新进展,推出全新英特尔至强6+处理器,发布以太网800系列新成员:英特尔以太网E835控制器及网络适配器,并披露了AI加速器路线图更新,包括新一代数据中心GPU Crescent Island的更多信息。他表示,通过至强6+和以太网E835,英特尔正在更紧密地耦合计算与网络,以减少现实世界智能体工作流中的瓶颈,并帮助其实现高效、安全的扩展。英特尔数据中心集团技术产品总监杨锦文进一步表示,至强6+相比第二代至强,还可带来约80%的空间节省和约73%的能源节省。


6月1日,英特尔宣布数据中心产品线多项最新进展,推出全新英特尔至强6+处理器,发布以太网800系列新成员:英特尔以太网E835控制器及网络适配器,并披露了AI加速器路线图更新,包括新一代数据中心GPU Crescent Island的更多信息。

英特尔至强6+处理器晶圆(图片来源:英特尔公司)

这组产品更新背后,传达了英特尔对当下AI基础设施趋势的观察:多智能体时代,数据中心的瓶颈不再只是单点算力,而是系统级协同能力。CPU、网络、GPU、内存、I/O和软件栈之间如何配合,正在成为智能体AI能否规模化落地的关键。

英特尔公司执行副总裁兼数据中心事业部总经理 Kevork Kechichian 表示,AI的扩展之道不在于简单堆叠GPU、CPU和网络等部件,而在于系统协同运作。随着AI迈向智能体时代,编排、并发和数据流动成为新的限制因素,这也再次强化了CPU作为现代AI基础设施控制平面的核心地位。

他表示,通过至强6+和以太网E835,英特尔正在更紧密地耦合计算与网络,以减少现实世界智能体工作流中的瓶颈,并帮助其实现高效、安全的扩展。

CPU重新回到AI基础设施中心

过去两年,AI基础设施讨论的核心更多围绕GPU展开,尤其是在大模型训练和前沿模型推理场景中,GPU被视为最关键的算力资源。但英特尔认为,随着AI应用进入智能体阶段,CPU的重要性正在重新上升。

原因在于,智能体并不是简单的一次模型调用,它往往涉及多步骤任务、多智能体协作、子智能体派生、工具调用、沙箱启动与销毁、上下文管理、任务调度、跨系统数据访问和持续执行。在这一过程中,GPU仍然承担推理、生成和优化任务,但CPU需要承担更复杂的编排、调度、执行、模拟和系统管理工作。

这也正在改变数据中心内部CPU与GPU的配比。英特尔数据中心芯片工程团队负责人Tim Wilson表示,过去,在大规模训练集群中,CPU与GPU的比例可能是1:8。但在智能体工作流中,CPU承担的任务正在增加,比例可能逐步向1:4、1:2甚至1:1变化,部分强化学习或复杂智能体场景中,CPU需求还可能进一步上升。

英特尔认为,这正是至强处理器的新机会。企业市场的大量业务负载、软件栈和现有基础设施已经构建在x86和至强平台之上。智能体要在企业环境中落地,往往不是推倒重来,而是在现有系统、数据库、应用服务、网络和云原生环境中进行扩展。因此,CPU作为系统控制平面,仍将承担重要角色。

英特尔预计,到2030年,基础工作负载与AI工作负载的增长大致各占一半,现有数据中心架构仍将承载接近一半的工作负载。这意味着,AI时代的数据中心不会只由加速器决定,x86架构仍会在传统业务、推理和智能体AI工作负载中保持重要位置。

基于Intel 18A,至强6+面向高密度智能体工作负载

此次发布的至强6+,是英特尔至强6家族的新成员,也是首款采用Intel 18A制程工艺打造的数据中心CPU。英特尔将其定位为面向云原生、5G核心网、智能体AI和网络密集型工作负载的高密度、高能效处理器。

英特尔至强产品总监 Kira Boyko 表示,现代5G核心网和云原生工作负载正在对基础设施提出更高要求,行业主要需求集中在三个方面:在更少机架空间内处理更多任务,提升每瓦性能以降低总体拥有成本,以及为关键业务部署提供更高可靠性。至强6+正是围绕这三类需求设计。

在核心规格上,至强6+最多提供288个能效核(E-core),支持最高8000 MT/s的DDR5内存,并配备最高576MB末级缓存(LLC),缓存容量较上一代产品提升超过5倍。该处理器还支持12通道DDR5内存、96条PCIe Gen 5通道以及CXL能力,以提升高密度系统中的内存带宽和异构基础设施数据流动能力。

制程方面,至强6+受益于Intel 18A中的PowerVia和RibbonFET等技术。其中,PowerVia通过更短、更直接的供电路径降低功耗,RibbonFET则有助于降低待机功耗并提升性能一致性。

英特尔还在至强6+中引入了应用能效遥测技术(Intel AET)。这一技术可以让数据中心运营商在工作负载层级实时查看CPU核心功耗与运行状态,从而支持更精细化的资源调度、成本分摊和能效优化。对于电信、云服务和企业数据中心来说,这类工作负载级能耗可见性,正在成为降低TCO的重要手段。

安全方面,至强6+通过英特尔SGX和TDX支持机密计算,并新增密码学算法加速能力。英特尔表示,这些能力不仅用于保护当前工作负载,也是在为企业和云环境中的可信计算构建基础。

在性能和能效之外,英特尔重点强调至强6+带来的数据中心整合能力。

英特尔称,相比第二代至强处理器,至强6+最高可实现9:1的服务器整合比例。也就是说,过去需要9台服务器承载的工作负载,现在可以由1台服务器完成。英特尔数据中心集团技术产品总监杨锦文进一步表示,至强6+相比第二代至强,还可带来约80%的空间节省和约73%的能源节省。

这意味着,对于已经部署大量传统工作负载的数据中心客户来说,至强6+不仅能提升既有负载运行效率,也可能通过压缩传统业务占用的机架空间、电力和散热资源,为AI集群释放更多基础设施容量。

至强6+也已经在电信网络基础设施中进行测试。英特尔表示,爱立信已在实际运营商部署中测试至强6+用于分组核心网。与上一代E-core相比,在相同核心数量下,性能提升约30%,每瓦性能提升超过60%,运行期间机架功耗降低38%。随着5G流量尤其是上行流量持续增长,这类能效提升对运营商控制成本和能耗至关重要。

目前,至强6+相关平台已经进入生态系统,包括华硕、戴尔科技、爱立信、技嘉、慧与、联想、超微等厂商提供或采用的服务器、网络和集成解决方案。

多Agent并发下,CPU要处理更多调度与沙箱任务

围绕智能体AI场景,英特尔进一步解释了至强6+的适配逻辑。

英特尔SoC架构专家曾义向InfoQ表示,在Agent任务中,会出现多个Agent和多个Sub Agent同时调用的情况。系统可能在短时间内频繁启动和销毁大量Agent或沙箱,这要求CPU具备更高并发密度和更强短期响应能力。至强6+作为单SoC最高支持288核心的架构,能够以较好的TCO支撑这类高密度Agent需求。

杨锦文表示,在至强6+ 288核心场景下,按照常见云服务中2个核心配4GB内存、或1个核心配2GB内存的配置,轻松部署400至500个以上Agent是比较常规的操作。具体上限取决于客户配置、任务类型和服务等级协议(SLA)要求。

不过,Agent并发不仅考验核心数量,也考验内存带宽和容量。曾义表示,当Agent数量增加后,每个Agent都需要对应的内存带宽和容量支持。如果只有带宽但容量不足,或者只有容量但带宽不足,都会形成瓶颈。英特尔希望通过DDR技术、更多内存通道和更高内存速率,在成本、容量和带宽之间取得平衡,从而最大化Agent部署密度。

此外,Agent时代也会带来更强的跨设备调度需求。AI系统可能频繁调用CPU、GPU、NPU、DSP、FPGA等不同计算单元,涉及低延迟任务分发、数据一致性管理和异构编排。曾义表示,这相当于对CPU核心算力、内存带宽与容量、I/O能力进行全方位压力测试。好的系统架构不仅要看某个接口的峰值能力,更要看CPU占用率提升到较高水平时,系统能否在各环节合理分配带宽,并保持总体性能均衡。

网络从“高速传输”走向系统能效优化

除了至强6+,英特尔此次还发布了以太网800系列新成员E835控制器及网络适配器。

随着AI、云和分布式工作负载持续扩展,网络已经不只是传输通道,而是影响整体系统效率的关键因素。英特尔认为,网络不能再只满足于“足够快”,还必须主动支撑系统能效优化。

E835聚焦性能、可靠性、灵活性和效率四个方向,面向现代数据中心、企业、边缘和AI环境提供网络连接能力。该产品支持最高200GbE以太网吞吐量,覆盖10GbE到200GbE数据速率,支持2×25G、4×25G、2×100G、1×200G等端口配置,并可通过英特尔以太网端口配置工具(EPCT)进行更多自定义。

在性能方面,E835支持RDMA,包括RoCEv2和iWARP,以降低CPU占用率并提升效率;同时支持动态设备个性化(DDP),以简化数据包处理流程并提升应用性能。

在能效方面,英特尔表示,E835的功耗约为主要竞争对手的一半。当以全双向200G线速运行时,E835功耗比同类产品低28%至47%,满载工作负载下每瓦性能达到同类产品的1.4至1.9倍。这意味着客户可以在不突破既有功耗和散热预算的前提下,提高网络密度和性能。

在可靠性和可管理性方面,E835支持硅芯片信任根、带签名SPDM、设备和固件证明,并支持NC-SI 1.2等可管理性协议。英特尔称,E835提供超过10年的产品生命周期和官方支持,有助于客户降低TCO并确保平台稳定性和供应连续性。

英特尔技术专家 Kevin Cai 表示,AI发展对网卡带宽、延迟、安全和管理能力提出了新要求。英特尔主要聚焦AI网络前端部分,E835相较同类产品在能效比上有明显提升,并通过广泛操作系统支持和长期互操作测试,为客户提供更灵活、高性价比的选择。目前已有不少客户开始E835适配工作,英特尔预计将很快与合作伙伴共同推向市场。

在边缘和电信场景中,E835还可与至强6高精度时钟提取与分发能力结合,用于5G专网等应用。Kevin表示,过去一些昂贵的纳秒级时钟提取设备,如今可以通过至强6加E835,以更低成本实现约10纳秒精度的时钟提取,并维持5G专网时钟同步。

面向智能体AI推理的大显存GPU

在AI加速器路线图方面,英特尔披露了新一代数据中心GPU Crescent Island 的更多信息。

英特尔AI加速器负责人 Anil 表示,推理和智能体AI正在成为AI领域增长最快的细分市场之一。智能体工作负载通常是多步骤、多推理、多计算的,并对内存提出前所未有的压力。更重要的是,智能体AI会推动Token生成量呈指数级增长,相关工作负载可能带来1000倍Token消耗增长。

在这一背景下,客户需要以合适成本、大规模且高效地交付Token。系统内部也会出现持续交互:GPU负责推理、思考、代码生成和优化,CPU负责组织、模拟、调度和执行。计算、网络、内存和软件都承受压力,因此基础设施设计必须重新平衡计算、内存、带宽、网络和I/O。

Crescent Island基于Xe3P架构,专为AI推理和智能体工作负载优化。英特尔称,该GPU采用LPDDR内存与高密度背面通道,最高支持480GB内存容量。由于LPDDR功耗较低,Crescent Island可将热设计功耗控制在350W,并采用风冷PCIe外形规格,适合现有风冷数据中心部署。

据悉,Crescent Island面向长上下文模型、大容量内存、高效率、低功耗和优化TCO而设计。更高内存容量使其能够支持超长上下文,并可存储多个模型,实现更快模型切换。该GPU支持广泛AI数据类型,并支持原生FP64,因此也具备面向部分HPC应用的潜力。

杨锦文表示,以国内先进大模型DeepSeek-V4为例,其标准版参数量为1.6T。在F8量化精度下,仅需4张最高480GB内存的Crescent Island GPU即可支持模型部署。当然,如果希望获得更理想运行效果,还需要更多显存容量。至于具体Token生成速度,英特尔此次尚未披露,将在后续合适时间发布更多细节。

软件栈:上游优先,降低AI部署阻力

英特尔强调,硬件之外,软件生态是至强和GPU产品能否成功落地的关键。

Kevork Kechichian 表示,企业级部署规模庞大,用户并不一定是深谙硬件细节的专家,他们真正关心的是能否顺畅运行框架和模型,并获得业务成果。因此,英特尔需要为每一代新硬件提供Day 0即刻支持,确保开发者和客户可以无缝使用底层库和框架。

这些框架既包括PyTorch、TensorFlow等主流框架,也包括vLLM、Llama、SGLang等面向推理和智能体的AI基础层和框架。英特尔表示,其开放式可编程AI软件栈会采用“上游优先”策略,将对至强CPU和英特尔GPU平台的支持合并到上游,以降低部署阻力。

Anil表示,英特尔围绕Xe软件栈构建了四项原则:开放、规模化性能、优秀用户体验和支持异构基础设施。基于这些原则,英特尔会支持行业标准框架,将GPU集成到现代部署环境中,并通过oneAPI等底层技术提供全栈AI软件能力。

英特尔还表示,Arc Pro B70软件开发工具包展示了开发者所需的前向和后向兼容性。未来,开发者可以在B70上开发,并部署到Crescent Island上。

展望后续路线图,英特尔还提到了下一代产品Diamond Rapids。

Kevork Kechichian 表示,英特尔正在从芯片级产品转向更深层次的机架级解决方案。他强调,在数据中心市场,“最终产品不是芯片,最终产品实际上是机架级别的”。英特尔需要进一步扩展到数据中心层面,面对成千上万个节点运行的场景,从系统、软件到节点行为进行端到端优化。

Diamond Rapids将在核心数量、性能和通道数量方面继续提升,其中包括16通道版本,并提供大量PCIe通道以支撑数据传输,避免核心因数据不足而闲置。英特尔将持续关注核心与带宽、核心与内存通道之间的平衡,为客户寻找最佳配置点。

杨锦文补充称,18A首先用于至强6+的E-core产品,主流是288核心的6900系列。P-core不会被替代,而是会随着产品线继续演进。2027年,英特尔下一代产品Diamond Rapids将基于18A P版本发布。英特尔希望通过多元化产品组合,在性能和能效上为客户提供差异化选择。

暂无回复,快来抢沙发吧!

  • 1 / 1 页
敬请注意:文中内容观点和各种评论不代表本网立场!若有违规侵权,请联系我们