人民币 • 跨境询价流程
返回 Blog
AI 基础设施2026/4/3

Intel MLPerf Inference v6.0 结果展示 Xeon 6 与 Arc Pro GPU 在 AI 负载上的可扩展性

Intel 在 MLPerf Inference v6.0 中的提交结果突出了 Xeon 6 CPU 与 Arc Pro B70/B65 GPU 组合在可扩展 AI 推理上的表现。对基础设施买家来说,这份基准数据为评估面向部署规模推理负载的 CPU‑GPU 平衡系统提供了具体性能参考。

原文日期

2026/4/1

阅读时长

5 分钟

高性能计算板卡上的密集半导体走线。
图片来源: Jakub Pabis

MLPerf v6.0 结果实际展示了什么

MLPerf Inference v6.0 包含四个基准测试,衡量不同模型类型和部署场景下的 AI 推理性能。Intel 的提交聚焦于将 Xeon 6 CPU 与 Arc Pro B 系列 GPU 配对使用的系统,既强调原始吞吐量,也强调从单节点到多 GPU 配置的可扩展性。

最值得注意的硬件配置是四 GPU Arc Pro B70 系统,它提供总计 128GB VRAM。这样的内存容量使系统能够高并发处理 120B 参数模型,这对需要同时处理多个请求的生产推理服务来说很重要。

为什么采购团队要看的不只是 GPU 峰值数字

基础设施买家通常只关注 GPU 指标,但 MLPerf 结果提醒我们,系统级性能取决于 CPU‑GPU 平衡、内存带宽、软件优化和散热设计。Intel 在同一硬件上从 MLPerf v5.1 到 v6.0 实现的 1.18 倍性能提升,展示了软件成熟度如何在不改变硬件的情况下释放额外性能。

我们的判断是,采购评估应同时包含基于硬件的基准测试和软件栈准备度。一个软件优化势头强劲的平台,即使初始硬件规格与竞品相似,也能在其生命周期内提供更好的总体拥有成本。

对 2026‑2027 推理部署的采购启示

计划在 2026 年末或 2027 年初部署推理基础设施的团队,在比较 CPU‑GPU 平台时应将 MLPerf v6.0 结果纳入考量。该基准测试提供了不同厂商提交之间的同类型性能数据,有助于将营销宣传转化为可比较的吞吐量和延迟数字。

实际的下一步是要求厂商提供具体的 MLPerf 配置细节和包含功耗、散热、软件许可和支持在内的总体拥有成本模型。对于预计并发量和模型规模会增长的推理负载,四 GPU Arc Pro B70 系统的 128GB VRAM 容量可能成为一个差异化因素。

相关文章

高性能计算板卡上的密集半导体走线。
制造与供应链5 分钟阅读
2026/4/3来源: Intel Newsroom

英特尔 18A 工艺迎来首个客户流片,预示2026年量产按计划推进

英特尔确认其 18A 制程工艺迎来首个客户流片,这是其制造路线图的关键里程碑。对评估先进制程选项的买家来说,这次发布强化了英特尔重获工艺领先地位的承诺,并为高性能计算、网络和汽车设计提供了台积电 N2 家族之外的另一个可信选择。

英特尔18A流片
高性能计算板卡上的密集半导体走线。
AI 基础设施5 分钟阅读
2026/4/3来源: NVIDIA Newsroom

NVIDIA 向 Marvell 投资 20 亿美元,扩展 NVLink Fusion 生态以接纳定制 XPU 合作伙伴

NVIDIA 宣布向 Marvell 投资 20 亿美元,并达成合作协议将 Marvell 的定制 XPUs 纳入 NVLink Fusion 生态。对基础设施买家来说,这个动作释放出一个更开放的 AI 工厂架构信号——NVIDIA 的机架级平台开始接纳合作伙伴的半定制芯片,这既降低了锁定风险,也为下一代 AI 集群扩大了供应基础。

NVIDIAMarvellNVLink Fusion
高性能计算板卡上的密集半导体走线。
AI 基础设施5 分钟阅读
2026/4/2来源: Qualcomm Newsroom

高通发布 Snapdragon X Elite Gen 2,瞄准 AI PC 性能领先地位

高通宣布推出第二代 Snapdragon X Elite 平台,宣称 AI 性能相比上一代最高提升 2 倍,能效提升 40%。对 PC OEM 和企业买家来说,这次发布意味着 AI PC 市场出现了一个更可信的替代选择,而每瓦性能和端侧 AI 能力正成为采购决策的关键因素。

QualcommAI PCSnapdragon X Elite