发现商业评论 旗下
洞察商业 启迪未来

华为云Agentic Infra技术革新:引领AI算力底座迈向全新进化时代

   时间:2026-06-06 18:34 来源:快讯作者:顾雨柔

在上海举办的2026华为云INSPIRE创想者大会Agentic Infra云基础设施技术论坛上,一场关于AI基础设施未来发展的深度对话拉开帷幕。本次论坛以"进化,从AI Infra到Agentic Infra"为核心命题,吸引了来自全球的顶尖技术专家、行业领袖与生态合作伙伴,共同探索智能体时代下云基础设施的技术革新路径。

华为云基础设施云服务产品线总裁鲍亮在开幕致辞中指出:"云计算已进入Token工业时代,计算范式正经历根本性变革。"他强调,传统基础设施难以支撑智能体时代对算力效率、记忆容量与自治能力的严苛要求。为此,华为云提出"Agentic Infra"新范式,通过构建"高效Token工厂+通智一体化调度+持续学习+安全自治"四大核心能力,重新定义AI算力底座。其中,灵衢智算集群AICS实现算力效率质的飞跃,存算一体架构突破记忆瓶颈,AgentSphere运行时环境确保安全部署,Volcano调度系统达成资源最优配置。

华为公司Fellow、云系统首席专家余洲系统阐释了"Agentic计算机"概念。他表示,这种新型基础设施将服务对象从人类转向AI,围绕万亿级Token处理进行全栈优化。通过软硬芯深度协同,华为云实现四大技术突破:灵衢网络将分散的CPU、NPU、SSD和内存构建成统一计算资源池;基于昇腾950的1024卡集群使算力提升2.6倍;记忆存储解决方案AMS提供PB级记忆空间,缓存命中率达95%;高性能极简网络支持算力与IO资源的动态配比。这些创新使推理效率、序列长度与速度指标均获得显著提升。

面对大模型训练中的资源利用率困境,华为公司Fellow、华为云服务首席架构师顾炯炯推出FlexNPU柔性液态算力架构。该架构在训练框架与硬件层间引入软件定义层,实现算子级时空复用与硬件故障隔离。测试数据显示,其将节点弹性恢复时间从分钟级压缩至秒级,单位Token算力成本降低63%,真正做到"算力零闲置,Token不浪费"。这种创新架构特别适用于多模型共卡、推理训练混合等复杂场景,为AI工程化落地提供关键支撑。

云原生计算基金会(CNCF)中国区总监陈泽辉分享了行业观察:Kubernetes作为AI操作系统,已在82%的企业生产环境中部署,Agentic AI部署比例更高达74%。CNCF TOC副主席王泽锋进一步揭示调度系统的演进方向,Volcano通过多调度器免锁并行架构,将Agentic工作负载调度耗时降低99%。在运行时层面,AgentCube与Kuasar的组合实现50毫秒级冷启动,Kthena路由感知算法将在630版本正式商用,这些突破标志着调度系统从工具属性升维为资源本体。

理论创新与实战验证形成闭环。AReal完成全栈算子适配,小红书Relax框架实现固量弹性动态平衡,面壁智能三值量化技术在昇腾卡上验证成功,芒果TV灵创平台完成视频模型昇腾适配。这些案例证明,华为云提供的不仅是技术组件,更是完整的工程化解决方案。当传统"堆卡"模式遭遇瓶颈,以Token为处理粒度、通智深度融合的"超级计算机"正在重塑行业格局。

 
 
更多>同类内容
全站最新
热门内容