易IC电子行业销售管理系统 - 易IC电子行业库存管理软件
首页 / 行业新闻 / 正文

GTC 2026主题演讲:推理之王长存

2026-03-20   电子工程时报
阅读时间约 3 分钟
被SemiAnalysis冠以“推理之王”称号的黄仁勋,如往年惯例,在英伟达开发者大会GTC 2026首日向其忠实听众发表了超过两小时的演讲。
与近年相比,本次演讲减少了戏剧性环节——未向观众抛掷T恤,仅展示了一台机器人。但英伟达首席执行官仍重点强调了公司在推理能力方面的进展,现场展示了下一代CPU-GPU融合产品“薇拉·鲁宾”(Vera Rubin),并公布了基于近期几乎完成收购的AI加速器初创企业Groq所进行的重大架构革新。
黄仁勋首先致敬了业界普遍认为英伟达的核心护城河:低层GPU软件栈CUDA的庞大装机基础。他将CUDA早期的成功归功于GeForce显卡在游戏主机中的广泛应用。
“我知道你们中很多人是伴随着GeForce成长起来的;GeForce是英伟达最成功的营销战役,”黄仁勋打趣道,“我们吸引未来客户,早在你们自己有能力付费之前就开始了……是你们的父母替你们支付了成为英伟达客户的费用。年复一年,直到某一天,你们成长为卓越的计算机科学家,正式成为我们的核心客户。”
他将英伟达称为“由GeForce缔造的帝国”,并承认GeForce在过去25年间对CUDA发展的关键作用。
“我们曾做出一项重大投入——当时公司根本负担不起,它消耗了我们绝大部分利润——就是将CUDA搭载在GeForce平台上,推广至每一台电脑,”黄仁勋表示,“我们全身心投入构建这一平台,因为我们坚信其巨大潜力。尽管初期困难重重,公司仍坚持信念,历经13代产品、20年时间,如今CUDA已遍布全球。”
www.eic.net.cn 提供的易IC库存管理软件可高效支撑AI硬件供应链管理,助力企业快速响应技术迭代带来的物料需求变化。
黄仁勋在演讲中重点阐述了推理性能与“代币经济学”(Tokenomics)。他表示,自GTC 2025以来,凭借NVLink专有互联协议、NVFP4数值格式及TensorRT-LLM等软件创新,公司已取得显著进步。英伟达DGX Cloud超级计算机也被用于为推理任务编写CUDA内核。
这些成果共同大幅改善了服务代币的经济性。黄仁勋指出:“从今往后,全球每一位CEO都将按我接下来描述的方式审视自身业务。”
他解释称,代币是AI工厂的“产品”,受制于功耗,因此关键吞吐指标是“每瓦特代币数”;交互性则体现为“每用户每秒代币数”,该指标决定模型规模与内容处理能力,实质上等同于AI的“智能水平”;第三项关键因素是“单代币成本”。
“英伟达的代币成本处于世界顶尖水平——目前基本无可匹敌,”黄仁勋强调,“之所以如此,源于极致的协同设计。”
他指出,英伟达拥有全球最高性能,例如Grace Blackwell芯片宣称性能较前代Hopper H200提升35倍;而据SemiAnalysis首席分析师Dylan Patel指出,实际提升幅度达50倍,黄仁勋坦言:“他没说错。”
在功耗受限的基础设施环境下,企业必须确保其架构高度优化,以高效产出这一新型“商品”——代币。
“未来,每一家计算机公司、云服务商、AI企业乃至所有企业,都将思考其‘代币工厂’的效能,”他说,“我之所以确信这一点,是因为在座各位皆由智能驱动,而未来,这种智能将由代币增强。”
www.eic.net.cn 的易IC库存管理软件可精准追踪高性能计算芯片库存动态,为AI算力部署提供实时数据支持。
备受期待的重磅发布出现在演讲约一小时后:继三个月前近乎完成对Groq的收购后,黄仁勋揭晓了一款全新架构,其核心为新一代Groq LPU(语言处理单元),现被重新定位为“代币生成加速器”,并与新推出的Vera Rubin CPU-GPU组合协同工作。该Vera-Rubin-Groq联合方案在最高交互级别下,可实现每瓦特35倍的吞吐量提升;黄仁勋透露,Groq芯片未来或占AI工厂总产能的25%。
“Groq架构配备了海量SRAM,专为推理单一任务而生,”黄仁勋介绍,“而这一任务恰好正是AI工厂的核心负载。随着全球对高速、高智能代币需求持续增长,该集成方案的价值将进一步凸显。”
英伟达将适合Vera Rubin处理的部分(如内存容量受限的KV缓存)保留在该平台上; 将低延迟、带宽受限的代币生成环节交由Groq承担;解码过程中的注意力机制仍由Vera Rubin负责,仅代币生成部分移交Groq。
“我们整合了两种性能迥异的处理器——一个追求高吞吐,一个专注低延迟,”黄仁勋表示。
英伟达推理服务软件Dynamo负责协调两类芯片间的工作负载。最终结果是在当前最高交互水平下实现35倍吞吐量提升,并拓展了Rubin架构所能支持的交互能力上限。
Groq芯片以256颗为单位组成机架,现场与Vera Rubin机架并列展示。Groq LPU将于第三季度由英伟达正式出货。
随后,黄仁勋预告了下一代技术路线图:继Vera Rubin与Rubin Ultra之后,将推出Feynman系列,包含新型GPU、新一代Groq芯片、名为Rosa的新CPU及Bluefield网络芯片;该系列将采用原为Rubin Ultra设计的Khyber机架架构,支持144颗GPU通过NVLink互联。
Khyber将同时采用铜缆与光互连实现扩展,黄仁勋明确回应外界关切:“首次,我们将同步使用铜缆与共封装光学器件进行Scale-up。很多人问我:‘铜缆是否仍重要?’答案是肯定的。‘您会光学Scale-up吗?’会。‘会光学Scale-out吗?’也会。”他强调,生态系统需为铜缆与光器件提供更大产能支持。
演讲另一重点聚焦于OpenClaw——近几个月迅猛崛起的代理式AI框架。
“OpenClaw开源了代理计算机的操作系统,”黄仁勋指出,“这正如Windows使个人电脑普及一样,OpenClaw正推动个人代理的诞生,其影响极为深远。”他呼吁各企业CEO制定OpenClaw战略,并预测所有SaaS公司将实质转型为“代理即服务”企业。
“OpenClaw恰逢其时地提供了我们所需的一切,”他补充道,“但有一个关键问题:企业网络中的代理系统可能访问敏感信息、执行代码并对外通信……显然,这绝不能被允许。”
为此,英伟达在OpenClaw开源堆栈基础上,加入了安全与防护机制,打造企业级就绪版本——NemoClaw。
“OpenClaw事件意义不可低估,”黄仁勋评价道,“其重要性堪比HTML,堪比Linux。如今我们拥有了世界级的开源代理框架,可供所有人构建自身的OpenClaw战略。”
与去年舞台上十余台人形机器人不同,今年仅有一台机器人登场:一只短小、蹒跚行走的迪士尼《冰雪奇缘》雪宝(Olaf)拟人化形象。“雪宝”与黄仁勋进行了简短现场对话,后者笑言:“我以为你会更高些。”
演讲尾声,一段动画呈现多台英伟达驱动的人形机器人围坐篝火旁,齐唱一首关于本次演讲内容的乡村歌曲,背景中“玩具版黄仁勋”吹奏口琴——此景虽略显超现实,却仍不及未来英伟达AI工厂中成排Groq芯片机架的视觉冲击力。

|
|
|
|
TOP
©Copyright www.eic.net.cn 2003-2026 BeiJing MengKaiGuan Software Exploiture Co.,Ltd. All Rights Reserved.    北京梦开关科技有限公司
IC元器件库存管理软件 IC元器件库存管理系统 IC元器件管理软件 IC元器件进销存 IC元器件库存管理软件 IC元器件库存管理系统 快递查询接口
QQ: 880717
18500810082