返回 Blog
AI 基础设施2026/4/9
Intel 与 SambaNova 发布基于 Xeon 6 的 Agentic AI 推理架构蓝图
Intel 与 SambaNova 发布了一套新的 Agentic AI 推理架构蓝图,采用 GPU 负责 prefill、SambaNova RDU 负责高吞吐 decode,并由 Intel Xeon 6 处理器承担主机与 action CPU 角色。两家公司表示,这一设计面向 2026 年下半年企业、云平台与主权 AI 部署,同时聚焦性能、效率与软件兼容性问题。
图片来源: Mikael Blomkvist
Intel 与 SambaNova 具体发布了什么
Intel 表示,双方已围绕一套面向新型 Agentic AI 推理工作负载的蓝图签署协议。按照 Intel 的描述,这一设计把工作拆分为三层:GPU 负责 prefill,SambaNova RDU 负责高吞吐 decode,Intel Xeon 6 处理器则承担主机与 action CPU 角色。
Intel 同时指出,这套方案的目标是解决企业把 Agentic AI 从试点推向生产级数据中心时,常见的性能、效率与软件兼容性约束。
这对采购与平台选型意味着什么
这条消息的重要性在于,它把 AI 推理基础设施重新定义为“混合算力采购问题”,而不是单纯的 GPU 采购决策。对于正在规划 AI 产能的买家来说,主机 CPU、加速器分工和软件兼容性需要一起评估,而不能再把每一层割裂开来做认证。
我们的判断是,这会让 Xeon 级主机 CPU 选型、加速器组合以及整机电源规划,在 2026 年的 AI 服务器 RFQ 讨论中持续保持核心地位,尤其是那些必须兼顾企业软件连续性或主权部署约束的买家。
面向 2026 年下半年落地前,买家应重点跟踪什么
Intel 表示,这套联合方案预计将在 2026 年下半年面向市场。对采购与项目团队来说,这意味着现在就有一个规划窗口,可以先明确 AI 栈中哪些环节需要提前与供应商沟通,哪些环节可以等平台进一步成熟后再锁定。
- 向平台供应商确认目标机柜设计中,Xeon 6 主机 CPU 与加速器栈是如何配比和分工的。
- 尽早明确软件验证是否依赖 x86 连续性、主权部署要求,或特定 decode 引擎方案。
- 在锁定长交期 BOM 假设前,持续跟踪企业与云部署的可供货时间点。