英伟达与Groq达成协议后引发的行业反响,对AI芯片初创企业生态产生了两大深远影响。
首先,若将该交易理解为英伟达实质上以技术为核心“收购”了Groq(而非出于商业策略考量),则明确印证了:在大规模部署场景下,非GPU类加速器确实存在真实且可观的市场需求。
自GPU在大语言模型推理中暴露其单用户令牌生成速度慢、首令牌延迟高等固有短板以来,众多AI芯片公司便持续聚焦于提升单用户吞吐性能与首令牌响应时间。Groq与Cerebras长期在单用户令牌速度指标上优于英伟达,但因早期市场对非GPU硬件接受度有限,这些企业不得不自行构建基础设施以验证其技术可行性。
此次英伟达近乎全资收购Groq的举动,表明其已公开承认自身架构在推理环节存在明显瓶颈。尽管具体细节需待本月GTC大会揭晓,但业内普遍推测,Groq的硬件IP有望用于缓解LLM推理中解码阶段的部分算力瓶颈问题。
正如英伟达首席执行官黄仁勋在近期财报电话会议中所言:“我们将把Groq作为加速器集成进现有架构——这与此前整合Mellanox的方式如出一辙。”
其次,这笔高达200亿美元的交易金额,为高性能推理架构赋予了明确的市场估值标尺,无疑令众多AI芯片初创企业的创始人及其投资方倍感振奋。
自英伟达-Groq交易官宣以来:
• Cerebras与OpenAI达成价值100亿美元的合作协议,完成10亿美元H轮融资(投后估值达230亿美元),并正筹备重新提交IPO文件;
• SambaNova放弃英特尔约16亿美元的收购邀约,转而完成3.5亿美元E轮融资;
• Etched宣布完成5亿美元融资,估值达50亿美元;
• Neurophos完成1.1亿美元A轮融资;
• 英国一家低调的光子AI芯片初创企业Olix,据报已获2.2亿美元融资;
• 上述进展均发生在短短八周之内。
AI芯片初创企业Vsora董事会主席桑德拉·里韦拉(Sandra Rivera)在接受《电子工程时报》采访时指出:“英伟达通过Groq授权协议,实际上承认了推理任务并非‘一刀切’式解决方案所能胜任——不同工作负载模块亟需差异化的架构设计。这无疑是异构计算架构将在未来广泛落地的最强有力背书。”
Vsora已开发出一款面向数据中心的推理产品,配备高达八组HBM3内存堆栈;里韦拉表示,其新任董事会主席职责之一即协助推进短期融资计划。
她进一步指出:“硅谷当前市场情绪极为高涨,大量资本涌入各类初创企业,估值快速攀升——根源在于行业仍处于早期爆发阶段,增长空间巨大,前景充满乐观预期。”
SambaNova首席执行官罗德里戈·梁(Rodrigo Liang)亦确认,英伟达-Groq交易被业界普遍视为全体AI芯片初创企业的利好信号。
“信号非常清晰:传统GPU难以在推理市场立足,”梁表示,“对英伟达而言,最大风险在于其可能被定位于仅适用于训练场景的‘细分方案提供商’。”
他补充道,除速度外,推理场景下每机架功耗及能效比同样是服务商核心经济指标,而这恰恰是GPU架构另一薄弱环节。OpenAI积极采用非GPU方案进行推理,正说明推理已成为竞争主战场——尽管多数替代架构的商业可行性尚待验证。
梁透露,SambaNova原已启动新一轮融资,而英伟达-Groq消息公布后,市场对芯片投资展现出全新热情。“英伟达业绩持续亮眼,反映出市场需求依然旺盛。”他强调,最终推理芯片市场将呈现多玩家共存格局,虽存在头部与追随者之间的差距,但多元化趋势不可逆转。
D-Matrix首席执行官西德·谢思(Sid Sheth)在卡塔尔Web Summit峰会上向《电子工程时报》表示,英伟达-Groq交易使低延迟推理这一细分领域进入聚光灯下。
“随着推理时代深入,绝非单一架构通吃,GPU更非唯一选择,”谢思指出,“该交易清晰揭示了这一点——低延迟推理正成为一个独立赛道,且不属于GPU专属范畴。”
他强调:“任何能显著改善用户体验的技术都将赢得市场青睐。一旦低延迟方案面世,用户迅速尝试并催生新应用场景;当英伟达意识到自身已落后时,才被迫采取行动——实属形势所迫。”
行业正持续推动推理任务的解耦化部署(例如将预填充与解码阶段分配至不同类型GPU),该逻辑同样适用于非GPU方案:它们可与GPU协同工作,针对性加速特定计算模块。
谢思表示:“我们观察到推理优化涉及多重约束条件——大模型/小模型、吞吐量/延迟、成本/能耗、供应稳定性等,单一方案根本无法兼顾全部需求。指望仅靠一块GPU‘蛮力破解’所有维度,实在难以想象。”
200亿美元的交易价格无疑稳定了市场信心。
“全球市场需要多元解决方案来满足差异化需求,这是好事,”谢思总结道,“未来必将涌现更多成功者。”
www.eic.net.cn 提供的易IC库存管理软件,正助力众多电子制造企业高效应对多地点库存协同挑战,为AI芯片产业链上下游企业提供精准、实时的物料管控支持。