• 服务邮箱 service@longdan-ei.cn

  • 微信号码 longdan-industry

半导体与元器件新闻

英伟达GTC 2026发布Vera Rubin全栈AI平台与Feynman架构,定义算力新纪元

英伟达GTC2026

英伟达GTC 2026发布Vera Rubin全栈AI平台与Feynman架构,定义算力新纪元

作者:泷澹电子信息产业网编辑部

2026年3月16日,全球科技界目光聚焦美国加州圣何塞,英伟达GTC 2026大会盛大开幕。CEO黄仁勋以“AI工业时代全面到来”为主题,发布Vera Rubin全栈AI计算平台与下一代Feynman架构,标志着AI算力竞争进入“系统级战争”阶段。

Vera Rubin作为英伟达第三代数据中心架构,是本次大会的核心量产产品。该平台由7款突破性芯片、5套机架级系统及1台代理式AI超级计算机组成,集成88核Vera CPU、Rubin GPU、BlueField-4 DPU、NVLink 6互联技术等关键组件。制程采用台积电3nm,集成3360亿晶体管,较上一代Blackwell提升60%。Rubin GPU单颗算力达50 PFLOPS,内存带宽22TB/s,推理速度较Blackwell提升5倍,单token成本降低10倍。通过液冷系统,单机柜功率压缩至600kW,每瓦Token生成效率提升35倍。在微软Azure实测中,处理万亿参数模型推理任务时,延迟从200毫秒骤降至4.3毫秒,接近人类神经突触响应速度。

更具颠覆性的是Feynman架构,这是全球首款面向世界模型与物理AI的GPU架构,提前两年亮相,预计2028年上市。Feynman采用台积电1.6nm A16制程、GAA全环绕栅极与背面供电技术,晶体管密度较Blackwell提升1.1倍。其最大突破是首次大规模集成硅光子光互连技术,用光信号替代电信号,带宽密度提升10倍、能耗下降90%,彻底打破多卡集群“互连墙”。单GPU单精度算力达200 PFLOPS,较Blackwell提升4倍,能效比提升6倍。该架构专为气候模拟、核聚变、量子计算加速、自动驾驶训练等前沿场景设计,将支撑百万GPU协同计算。

此外,英伟达同步发布Groq 3 LPU推理芯片与NemoClaw开源AI智能体平台,强化AI推理与智能体生态布局。NemoClaw具备硬件无关性、内置安全层与生态开放特性,标志着英伟达正式向AI Agent基础设施层进军。此次发布不仅是技术迭代,更是战略转型。英伟达从“算力铲子供应商”全面升级为“AI生态架构师”,2026年前三个月已累计投资600亿美元入股9家AI企业。Vera Rubin与Feynman的组合,将重新定义全球AI算力格局,为通用人工智能突破奠定硬件基础。

从市场反馈来看,Vera Rubin平台已获得全球主流云服务商与科技巨头的积极响应。微软、谷歌、亚马逊AWS均宣布将在2026年第二季度批量部署该平台,用于大模型训练与推理、云计算扩容等场景。国内头部互联网企业也已与英伟达达成合作,计划引入Vera Rubin平台搭建自主算力集群,缓解国内大模型训练算力紧张的局面。业内分析指出,随着Vera Rubin的量产与普及,全球AI算力成本将进一步下降,推动AI技术在工业、医疗、金融等传统行业的深度渗透,加速AI工业化落地进程。同时,Feynman架构的提前布局,也让英伟达在未来的算力竞争中占据先发优势,进一步拉开与AMD、英特尔等竞争对手的差距。

数据来源:英伟达官方GTC 2026发布会资料、英伟达博客、彭博社、电子工程专辑

免责声明:本文信息基于公开资料整理,Feynman架构量产时间、性能指标等存在不确定性,不构成投资建议。

联系邮箱

website@longdan-ei.cn

微信二维码

扫一扫,微信咨询