英伟达创始人兼CEO黄仁勋在近日举行的GTC大会上发表主题演讲,宣布公司正从“芯片公司”向“AI基础设施和工厂公司”转型。他提出“Token工厂经济学”概念,详细阐述了驱动未来AI增长的底层商业逻辑,并预测到2027年全球AI基础设施市场规模将达到至少1万亿美元。
黄仁勋指出,随着AI大模型从感知、生成向推理和行动任务进化,全球AI计算需求呈指数级增长。他透露,英伟达去年预测到2026年有5000亿美元需求,如今这一数字已上调至2027年的1万亿美元,且实际需求可能更高。这一预期推动英伟达股价在演讲后一度上涨超4.3%。
英伟达的系统已证明自己是全球“成本最低的基础设施”,能够运行几乎所有领域的AI模型。目前,公司60%的业务来自超大型云服务商,其余40%则分布在主权云、企业、工业、机器人和边缘计算等领域。黄仁勋强调,这种通用性使客户投入的1万亿美元能够被充分利用并保持长久的生命周期。
为了解释万亿需求的合理性,黄仁勋提出“Token工厂”概念。他指出,未来的数据中心将不再是存储文件的仓库,而是生产Token的工厂。在电力限制下,每瓦性能将成为决定商业命脉的关键因素。英伟达将AI服务分为免费层、中级层、高级层、高速层和超高速层五个商业层级,定价从每百万Token 3美元到150美元不等。
黄仁勋展示了英伟达最新的AI计算系统Vera Rubin。该系统采用100%液冷设计,安装时间从两天缩短至两小时。通过极致的端到端软硬件协同设计,Vera Rubin在两年内将Token生成速率从2200万提升至7亿,实现了350倍的增长,远超摩尔定律的1.5倍提升。
为解决极速推理条件下的带宽瓶颈,英伟达整合了被收购公司Groq的技术,采用非对称式分离推理方案。Groq芯片拥有500MB的SRAM,而Rubin芯片则配备288GB内存。通过Dynamo软件系统,英伟达将预填充阶段交给Vera Rubin处理,将解码阶段交给Groq处理。黄仁勋建议,高吞吐工作负载可100%使用Vera Rubin,而高价值编程级Token生成需求则可拿出25%的数据中心规模给Groq。
在硬件创新之外,黄仁勋还重点介绍了AI软件和生态的革命。他将开源项目OpenClaw形容为“人类历史上最受欢迎的开源项目”,称其仅用几周时间就超越了Linux在过去30年取得的成就。OpenClaw本质上是一个智能体计算机的“操作系统”,能够管理资源、执行调度、分解问题并调用子智能体。
黄仁勋断言,每一个SaaS公司都将变成AaaS(Agent-as-a-Service)公司。为帮助企业安全落地智能体技术,英伟达推出了企业级的NeMo Claw参考设计,增加了策略引擎和隐私路由器。对于普通职场人,黄仁勋描绘了未来职场新形态:工程师将拥有年度Token预算,基础年薪外再配给相当于薪资一半的token额度,以实现10倍效率提升。
演讲最后,黄仁勋“剧透”了下一代计算架构Feynman,它将首次实现铜线与CPO的共同水平扩展。更引人遐想的是,英伟达正在研发部署在太空的数据中心计算机“Vera Rubin Space-1”,彻底打开了AI算力向地球之外延伸的想象空间。











