滚动资讯

中国团队重构网络架构：万卡集群不加GPU，算力与效率双提升

时间：2026-05-21 15:42 来源：快讯作者：柳晴雪

当全球AI大模型厂商还在比拼GPU数量时，中国团队已悄然开辟新战场——通过重构网络架构，在未增加任何硬件成本的情况下，将推理集群算力提升15%。智谱联合清华大学、驭驯网络研发的ZCube架构，在GLM-5.1生产集群中实现突破性验证，这项发表于ACM SIGCOMM 2025的成果，被国际学术界评价为"将重塑网络设计范式"。

传统数据中心沿用二十年的Fat-Tree/Clos架构，在应对大模型推理时暴露致命缺陷。当32卡集群将网络带宽从100Gbps升级至200Gbps，推理吞吐提升19%的同时，首Token时延下降22%——这组智谱实测数据揭示残酷现实：GPU性能天花板正被网络拥塞锁死。在PD分离部署场景中，Prefill与Decode节点间动态不对称的数据流，使传统架构的热点堆积问题愈发突出，万卡集群中甚至出现30%的GPU因等待数据传输而闲置。

ZCube架构的颠覆性在于彻底重构拓扑逻辑。其核心设计原则确保任意两张GPU间仅存在一条最优路径，通过消除多路径选路冲突，从架构层面将结构性拥塞概率降低80%。更关键的是2跳网络直径设计——既突破单层组网的规模限制，又避免传统二层架构的延迟累积。这种"专属路网"模式使千卡集群的推理吞吐提升15%，TTFT P99延迟下降40.6%，同时削减三分之一交换机与光模块成本。在万卡规模下，仅光网络硬件即可节省2.1-6.4亿元。

这场架构革命带来的连锁反应正在重塑产业链。当OpenAI联合NVIDIA等巨头推出MRC多路径协议时，两种技术路线形成有趣互补：MRC通过智能调度优化"交通规则"，ZCube则通过拓扑重构预防"道路拥堵"。这种差异使以太网加速取代InfiniBand成为主流选择——Dell'Oro数据显示，2025年AI后端网络中以太网份额已超60%，800G光模块需求随之激增。

在智谱的千卡生产集群中，ZCube改造涉及重新设计布线模式、IP编址和路由策略等复杂工程。驭驯网络开发的自动化工具包，使原本需要数月的改造工程压缩至两周内完成。这种"零代码修改"的升级模式，为存量AI基础设施提供了立竿见影的优化路径。当行业开始重新评估算力价值时，ZCube证明：通过系统级创新挖掘现有硬件潜力，其经济效益不亚于新增GPU投入。

随着推理集群向十万卡规模演进，网络瓶颈正呈现指数级放大趋势。ZCube架构展现的扩展性令人瞩目：单层Leaf交换机即可支持16384块400G网卡互联，若采用更高密度交换机，理论可连接数十万GPU。这种"扁平化"设计使规模效应产生质变——集群越大，省下的交换机和光模块成本越多，性能优势越显著。当AI竞争进入深水区，网络架构正在从底层支撑转变为核心生产力，这场静悄悄的革命或将重新定义算力竞赛规则。

更多>同类内容

GPS北斗双模对时器：双系统保障，让时间同步更稳定可靠

为了解决这个问题，市面上有一种设备可以同时接收两种卫星信号，叫做GPS北斗双模对时器。GPS北斗双模对时器，就是一台既能接收GPS卫星信号、又能接收北斗卫星信号的授时设备。从硬件上看，GPS北斗双模对时器…

05-21

俄对华天然气价再降且低于欧洲，欧洲市场失守，中俄能源博弈新局开启

05-21

山姆30年首现“双店同开”：山东中产消费崛起，仓储会员战新篇开启

05-21

外卖补贴战正酣，霸王茶姬“不跟风”，凭硬功夫走出消费品牌突围路

05-21

马斯克薪酬新机制：火星建成百万人口聚居地或成其薪酬解锁关键条件

05-21

马斯克：SpaceX向Anthropic供AI算力服务，正与其他公司洽谈合作

05-21

OpenAI或本周秘密递表IPO，与SpaceX竞逐华尔街资金，AI领域资本大战一触即发

05-21

潘刚战略领航伊利创新前行业绩飘红助力乳业振兴与健康中国

05-21

特斯拉监督版FSD入华消息引爆市场，无人驾驶概念股早盘集体飘红多股涨停

05-21

科创人工智能ETF汇添富午盘微涨0.16% 成交额近千万重仓股表现分化

来源：新浪基金∞工作室 5月20日，截止午间收盘，科创人工智能ETF汇添富（589560）涨0.16%，报1.218元，成交额976.11万元。科创人工智能ETF汇添富（589560）重仓股方面，芯原股份截止…

05-21

零一万物携手AMD推出Cube01：共探多智能体时代企业智算新未来

作为一款多智能体时代的企业级私有化智算产品，Cube01 基于强大的 AMD 锐龙 AI Max+ 395旗舰处理器与零一万物万智智能体平台打造，旨在通过“算力 + 模型 + 多智能体协同”的软硬一体化能…

05-21

渣打集团计划裁员近8000人，CEO：以机器替代部分岗位提升组织效率

同时还披露了人均效能提升目标与裁员计划：2028年前实现人均创收提升约20%，2030年前削减超过15%的企业职能相关岗位。若以集团全球约8.2万名员工总数计算，此次裁员将波及近8000个工作岗位。公告…

05-21

零一万物携手AMD发布Cube01，共探多智能体时代企业智算新未来

05-21

APEC贸易部长会议在苏州启幕环球好物齐聚共享中国消费新机遇

05-21

阿里Qwen3.7-Max发布：国产模型新标杆，Agent时代竞争再升级

因此，Qwen3.7-Max 的发布是阿里把模型、云、MaaS、开发者工具和真实业务场景连接起来，参与 Agent 时代竞争的一个重要节点。它既是千问模型能力的一次更新，也是阿里把模型、云服务、MaaS、应…

05-21

点击查看更多 +

全站最新

38岁绍兴青年金锋：借传奇IP崛起，恺英网络多元布局谋新篇

马斯克透露SpaceX为Anthropic供AI算力还将向其他公司拓展服务

OpenAI或本周秘密递表IPO，与SpaceX竞逐华尔街资金成焦点

马斯克薪酬新机制：火星建成百万人口聚居地或成其薪酬解锁关键条件

贝索斯拟捐大部分财富应对气候变化，现身价1293亿全球第四

零一万物携手AMD推出Cube01：共探多智能体时代企业智算新未来

热门内容

本栏最新

马斯克薪酬新机制：火星建成百万人口聚居地或成其薪酬解锁关键条件

零一万物携手AMD推出Cube01：共探多智能体时代企业智算新未来

渣打集团计划裁员近8000人，CEO：以机器替代部分岗位提升组织效率

雷军直言小米YU7GT“有点小贵” 豪华定位配高性能或成市场新宠

长光卫星贾宏光放话：8年内中国商业航天成本更低，全面超越马斯克

深空字节CEO张中洋亮相上海太空算力研讨会，共启“星枢”新篇赴星海

发现者网 - 深度洞察行业动态引领市场先锋平台 - 发现商业评论旗下网站北京·通州天津·滨海山东·济南
发现者网（www.fxw.com.cn）所有稿件免费开放转载，转载请务必保留版权。
合作微信：netspread（注明:发现者网）
Copyright © FXW 2012-2023 www.fxw.com.cn All rights reserved. 鲁ICP备2022032383号-3 鲁公网安备37010202700500号