Arm 35年来首次造芯,AGI CPU 背后的豪赌与野心

 Arm 35年来首次造芯,AGI CPU 背后的豪赌与野心

昨天,在旧金山举办的”Arm Everywhere”活动上,Arm CEO Rene Haas 揭开了ARM公司成立35年以来最具颠覆性的一步,发布首款自主设计的数据中心芯片 Arm AGI CPU

呃~不是之前那种自主设计架构然后玩”IP“授权了,这回亲自下场,自主设计芯片,然后交给台积电代工,这标志着这家英国芯片巨头从”IP授权商”到”芯片制造商”的历史性转身。是AGI赛道太暴利了嘛 😂

长期以来,Arm 的商业模式堪称半导体行业最优雅的存在。它不生产任何物理芯片,而是将自己的处理器架构设计授权给苹果、高通、英伟达、三星等巨头,从中收取授权费和版税。全球99%的高端智能手机运行在 Arm 架构之上,超过2800亿颗基于 Arm 的芯片已经出货。这种”轻资产”模式让 Arm 的毛利率高达98%,远超英伟达的约70%。

但如今,Arm 选择了一条完全不同的赛道。AGI CPU 是 Arm 首款以自有品牌直接面向客户销售的成品芯片,交由台积电采用3纳米工艺制造,也就是说,ARM现在要亲自下场来与Intel、AMD进行搏杀了。

一颗为”AI智能体”而生的CPU

AGI CPU 中的”AGI”并非指通用人工智能本身,而是 Arm 对这颗芯片设计理念的一种宣言,它被”极致优化”以服务于实现 AGI 所需的基础设施。

在技术规格上,AGI CPU 配备多达136个 Arm Neoverse V3 核心,采用双芯片设计,功耗为300瓦。它支持 PCIe Gen 6、CXL 3.0 和高达 DDR5-8800 的内存规格,每核心可提供 6GB/s 的内存带宽,延迟低于100纳秒。

但真正值得关注的不是这些参数本身,而是 Arm 对 AI 基础设施演进方向的判断。过去两年,GPU 几乎垄断了 AI 领域的注意力。然而随着 AI 从”训练大模型”走向”部署持续运行的智能体”,CPU 的角色正在发生根本性变化。AI 智能体需要编写代码、调度任务、协调数据流——这些本质上是通用计算任务,而非 GPU 擅长的大规模并行运算。嗯,Arm是嗅到味了。

英伟达近期也对外表示,CPU 正在成为 AI 基础设施的”瓶颈”。研究机构 Futurum Group 甚至预测,到2028年 CPU 市场增速可能超过 GPU。

Arm 正是瞄准了这一机遇。该公司预计,随着智能体的普及,每吉瓦数据中心容量所需的 CPU 核心数将增长4倍以上。

AGI CPU 的设计理念也因此与传统 CPU 截然不同。Arm 云 AI 业务负责人 Mohamed Awad 表示,团队刻意剔除了那些不会被目标工作负载充分利用的传统功能和加速器,以节省芯片面积。他还透露,与英伟达的 Vera CPU 不同,AGI CPU 放弃了同步多线程技术(SMT),选择每核心一个线程的方式以实现更确定性的性能表现。

在部署密度方面,Arm 的参考配置是1U双节点设计,单刀片搭载两颗芯片共272个核心。在标准36kW风冷机架中可装入30个刀片,提供8160个核心。Arm 还与 Supermicro 合作设计了200kW液冷方案,单机架可容纳336颗 AGI CPU,总计超过45000个核心。Arm 声称这一配置较最新 x86 系统可提供超过两倍的每机架性能,并有望为每吉瓦 AI 数据中心节省高达100亿美元的资本支出。

Meta 是 AGI CPU 的首发合作伙伴和联合开发者。Meta 基础设施负责人 Santosh Janardhan 在发布会上详述了公司的规模——每天约35亿活跃用户,AI 集群从2023年初的128个 GPU 迅速扩展到如今单集群数万个 GPU。Meta 正在路易斯安那州、俄亥俄州和印第安纳州大规模兴建 AI 数据中心,其中名为”Prometheus”的项目预计今年年底前将超过1吉瓦,”Hyperion”项目则预计在几年内达到5吉瓦。

Janardhan 表示,Meta 在调研市场后发现,现有方案无法同时满足性能和功耗要求,因此选择与 Arm 合作。对 Meta 而言,功耗是极度稀缺的资源,一颗能提供最佳性能功耗比的 CPU 意味着可以将更多电力预算分配给基础设施的其他部分。

芯片分析师 Patrick Moorhead 估算,即使 Arm 只拿到 Meta 每年1150亿至1350亿美元资本支出的5%,这也将对其营收产生变革性影响。双方已承诺在多代 AGI CPU 路线图上展开长期合作。

生态系统的全面响应

除 Meta 外,Arm 宣布了一份令人印象深刻的合作伙伴名单。OpenAI、Cerebras、Cloudflare、F5、Positron、Rebellions、SAP 和 SK Telecom 等公司均计划在各自的基础设施中部署 AGI CPU,应用场景涵盖加速器管理、智能体编排以及云应用托管等。

在 OEM 层面,联想、Supermicro、ASRock Rack 和广达电脑正在开发搭载 AGI CPU 的服务器系统,商用系统现已可以订购,预计在今年下半年大规模上市。

更广泛的行业支持来自超过50家公司,涵盖超大规模云服务商、芯片厂商、存储供应商和网络公司,包括 AWS、博通、谷歌、Marvell、美光、微软、英伟达、三星、SK 海力士和台积电。

挑战与质疑

尽管势头强劲,Arm 面临的挑战不容小觑。

首先是与客户关系的微妙变化。Arm 的大多数授权客户——包括 Meta 本身——都在自研芯片。从授权商变成直接竞争者,可能引发生态系统内的紧张关系。其次,英伟达刚刚在 GTC 大会上发布了定位相同市场的 Vera CPU,在数据中心 CPU 领域的竞争将更加激烈。

美国银行对此持较为审慎的态度,指出执行风险和进入资本密集型业务的潜在挑战,维持中性评级。而传统智能手机市场承压也给 Arm 的短期增长带来了不确定性。

不过,汇丰分析师 Frank Lee 则相当乐观,认为 Arm 的服务器 CPU 版税收入最终可能追平其当前的总营收规模,到2030年有望达到40亿美元。

未来路线图:从30亿到万亿

Haas 在发布会上明确宣布了后续产品规划——AGI CPU 2 和 AGI CPU 3 已在路线图之中。这传递了一个清晰的信号:这不是一次性的试水,而是一项长期战略承诺。

在商业前景方面,Arm 表示其 AI 数据中心业务目前的版税市场总量约为30亿美元,而 AGI CPU 项目有望将机会扩大至1000亿美元,到本世纪末更可能触及超过1万亿美元的市场。公司预计五年内总营收将达到约250亿美元——是当前水平的五倍,其中新芯片业务的营收将超过传统 IP 授权业务。

这是一场豪赌。Arm 正在用35年积累的技术声誉和生态系统信任,去撬动一个从未涉足过的商业领域。但在 AI 重塑全球计算基础设施的时代,不下注可能才是更大的风险。正如 Haas 所言,这是 Arm 的”决定性时刻”。当一家公司35年来第一次亲手制造芯片,而排队购买的客户名单上写着 Meta 和 OpenAI 的名字,你很难不对这个故事的后续充满好奇。

❤️ 如果这篇文章对您有帮助,欢迎打赏支持

微信打赏二维码

扫描上方二维码,用微信打赏

吴川斌

Leave a Reply