
编者按:AI芯片战场硝烟再起!当全球目光聚焦于英伟达与OpenAI这对“黄金搭档”时,一场暗流涌动的技术博弈已然拉开序幕。最新消息显示,OpenAI对英伟达部分最新AI芯片的性能并不满意,自去年起已悄然寻找替代方案。这不仅可能撼动两家公司在AI狂潮中的紧密联盟,更揭示了行业竞争的新焦点:从训练大模型转向推理效率的生死竞速。随着OpenAI牵手AMD、Cerebras等玩家,英伟达迅速以收购、授权等方式加固护城河,一场围绕芯片内存架构、响应速度与生态控制的暗战正在上演。这场巨头间的微妙角力,或将重新定义AI基础设施的未来格局。
旧金山,2月2日消息:据八位知情人士透露,OpenAI对英伟达部分最新人工智能芯片并不满意,自去年起已开始寻求替代方案。此举可能使这两位AI热潮中最受瞩目的巨头之间的关系复杂化。
ChatGPT制造商的这一战略转变——其细节首次在此披露——源于其对用于执行AI推理特定环节的芯片日益重视。AI推理是指像驱动ChatGPT应用的模型那样,响应客户查询和请求的过程。英伟达在训练大型AI模型的芯片领域仍占主导地位,而推理已成为竞争的新前沿。
OpenAI及其他公司在推理芯片市场寻找替代品的决定,标志着对英伟达AI主导地位的一次重大考验,且正值两家公司进行投资谈判之际。
去年9月,英伟达表示计划向OpenAI投入高达1000亿美元,作为交易的一部分,这将使这家芯片制造商获得该初创公司的股份,并为OpenAI提供购买先进芯片所需的资金。
据路透社报道,该交易原本预计在数周内完成。然而,谈判已拖延数月。在此期间,OpenAI已与AMD等公司达成协议,获取旨在与英伟达竞争的GPU。但一位知情人士表示,其不断变化的产品路线图也改变了其所需的计算资源类型,并使与英伟达的谈判陷入僵局。
周六,英伟达CEO黄仁勋驳斥了与OpenAI关系紧张的报道,称这种想法“无稽之谈”,并表示英伟达计划对OpenAI进行巨额投资。
英伟达在一份声明中表示:“客户继续选择英伟达进行推理,因为我们在规模化上提供了最佳性能和总体拥有成本。”
OpenAI的一位发言人在另一份声明中表示,公司依赖英伟达为其绝大部分推理计算集群提供动力,并且英伟达在推理上提供了每美元最佳性能。
在路透社报道发布后,OpenAI首席执行官萨姆·阿尔特曼在X上发帖称,英伟达制造了“世界上最好的人工智能芯片”,并且OpenAI希望在未来很长一段时间内仍然是其“巨大的客户”。
七位消息人士称,OpenAI对英伟达硬件在回应ChatGPT用户关于特定类型问题(如软件开发和AI与其他软件通信)时的答案生成速度并不满意。其中一位消息人士告诉路透社,它需要新的硬件,最终将满足OpenAI未来约10%的推理计算需求。
两位消息人士称,ChatGPT制造商已讨论与包括Cerebras和Groq在内的初创公司合作,以提供用于更快推理的芯片。但其中一位消息人士告诉路透社,英伟达与Groq达成了一项200亿美元的授权协议,使OpenAI的谈判中止。
芯片行业高管表示,英伟达决定吸纳Groq的关键人才,似乎是为了巩固其技术组合,以便在快速变化的AI行业中更好地竞争。英伟达在一份声明中表示,Groq的知识产权与英伟达的产品路线图高度互补。
英伟达的替代方案
英伟达的图形处理芯片非常适合于训练像ChatGPT这样的大型AI模型所需的大规模数据处理,这些模型支撑了迄今为止全球AI的爆炸性增长。但AI的进步日益侧重于使用训练好的模型进行推理和逻辑判断,这可能是一个新的、更大的AI阶段,这也激发了OpenAI的努力。
自去年以来,ChatGPT制造商寻找GPU替代品的重点,放在了那些构建将大量内存(称为SRAM)嵌入到芯片同一片硅上的公司。在每个芯片上尽可能压缩昂贵的SRAM,可以为聊天机器人和其他AI系统在处理数百万用户的请求时提供速度优势。
推理比训练需要更多的内存,因为芯片需要花费相对更多的时间从内存中获取数据,而不是执行数学运算。英伟达和AMD的GPU技术依赖于外部内存,这增加了处理时间,并减慢了用户与聊天机器人交互的速度。
一位消息人士补充说,在OpenAI内部,这个问题在其积极推广的用于创建计算机代码的产品Codex中变得尤为明显。一位消息人士称,OpenAI员工将Codex的部分弱点归因于英伟达基于GPU的硬件。
在1月30日与记者的电话会议上,阿尔特曼表示,使用OpenAI编码模型的客户将“非常看重编码工作的速度”。
阿尔特曼说,OpenAI满足这一需求的方式之一是通过最近与Cerebras达成的协议,并补充说,对于普通的ChatGPT用户来说,速度不那么紧迫。
像Anthropic的Claude和Google的Gemini这样的竞争产品,受益于更依赖于Google内部制造的芯片(称为张量处理单元或TPU)的部署。这些TPU专为推理所需的那类计算而设计,与像英伟达设计的GPU这样的通用AI芯片相比,可能提供性能优势。
英伟达在行动
知情人士称,随着OpenAI明确表示对英伟达技术有所保留,英伟达接洽了致力于开发SRAM密集型芯片的公司,包括Cerebras和Groq,商讨潜在收购。Cerebras拒绝了,并于上月宣布与OpenAI达成了商业协议。Cerebras拒绝置评。
据熟悉讨论情况的人士透露,Groq曾与OpenAI就提供计算能力的交易进行谈判,并获得了投资者的兴趣,拟以约140亿美元的估值对公司进行融资。Groq拒绝置评。
但消息人士称,到了12月,英伟达采取行动,通过一项非排他性的全现金交易获得了Groq技术的授权。尽管该协议将允许其他公司授权Groq的技术,但随着英伟达挖走了Groq的芯片设计师,该公司现在正专注于销售基于云的软件。




