英伟达CTO(兼CEO)黄仁勋:GTC 2026聚焦推理与AI基础设施
英伟达CTO(兼CEO)黄仁勋:GTC 2026聚焦推理与AI基础设施
作者:泷码首席技术官(CTO)平台编辑部
2026年3月16日,全球人工智能与算力巨头英伟达(NVIDIA)举办的GTC 2026大会正式开幕,公司首席技术官(CTO)兼首席执行官(CEO)黄仁勋发表主题演讲,宣布英伟达的战略重心将从“单纯的算力供给”转向“推理能力提升+AI基础设施完善”,同时发布多款重磅产品,包括开源AI Agent平台NemoClaw、整合Groq LPU的推理芯片,以及Rubin Ultra AI超级计算平台,全面定义AI工业时代的技术底座。
此次大会的核心亮点是Feynman芯片架构的亮相,这款以物理学家理查德·费曼命名的下一代GPU架构,原定2028年发布,此次提前两年曝光技术原型,成为黄仁勋口中“最重磅的世界惊喜”。Feynman是全球首款专为“世界模型”设计的GPU架构,采用台积电A16 1.6nm制程,是英伟达首款进入1nm时代的量产芯片,晶体管密度较上代提升1.1倍;首次大规模采用硅光子光互连技术,用光信号替代铜缆电信号,实现带宽密度10倍提升、传输能耗90%下降,彻底打破超大规模AI集群的“互连墙”,为百万级GPU协同、万亿参数模型训练铺平道路。性能方面,Feynman较前代Blackwell架构推理性能飙升5倍,单GPU算力达50 PFLOPS,同时通过超级电轨背面供电技术,将芯片功耗降低15%。
除硬件创新外,黄仁勋重点介绍了开源AI Agent平台NemoClaw,该平台精准填补了OpenAI收购OpenClaw后,企业对安全、可控、独立的AI智能体平台的需求缺口。NemoClaw采用硬件无关设计,不仅能运行在英伟达GPU上,还支持AMD、Intel等其他处理器,打破了英伟达长期以来的硬件绑定壁垒;同时深度集成英伟达NeMo框架、Nemotron模型系列和NIM推理微服务,为企业提供从模型训练到智能体部署的全流程工具,预置多种垂直场景智能体模板,可快速对接主流企业软件,实现即插即用。此外,英伟达还披露了Rubin Ultra平台细节,一个Rubin Ultra机柜将集成144颗GPU,构建起高达1.5PB/s的Scale-up网络,推动AI基础设施从“单个芯片”向“整柜系统”升级,践行“AI工厂”的战略理念。
数据来源:氕氘氚《英伟达 GTC 2026 开幕!Feynman 1.6nm 芯片 + 开源平台重塑 AI 格局》(2026年3月16日)、英伟达GTC 2026大会官方直播实录

