发现商业评论 旗下
洞察商业 启迪未来

华为云张平安:盘古大模型5.5发布,昇腾AI云服务打造世界顶尖大模型

   时间:2025-06-20 19:42 来源:ITBEAR作者:沈如风

华为开发者大会HDC 2025上,华为云计算迎来重大突破,华为常务董事及云计算CEO张平安隆重推出了盘古大模型5.5版本。此次升级覆盖了自然语言理解NLP、计算机视觉CV、预测、多模态以及科学计算五大核心领域,为行业注入了全新的活力与价值。

张平安在大会上强调,盘古大模型5.5是基于昇腾云的强大全栈软硬件环境训练而成,这一里程碑式的成就标志着昇腾架构在全球大模型领域的卓越实力。他的话语中充满了自豪与期待。

在NLP领域,盘古大模型5.5引入了全新的718B深度思考模型,这是一个由256位专家构成的MoE(混合专家)大模型。它在知识推理、工具调用及数学等多个维度实现了显著增强,展现了业界领先的能力。通过一系列创新算法,如通算掩盖、全局动态均衡以及分组混合专家MoGE,盘古大模型在昇腾平台上实现了高效训练和推理,MFU训练和单卡推理吞吐均达到了业界顶尖水平。

盘古大模型5.5在用户体验方面进行了全面升级,特别是在高效长序列处理、低幻觉现象控制、快慢思考融合以及Agent技术等方面。其中,自适应快慢思考合一技术尤为引人注目。该技术通过构建难度感知的数据集和两阶段渐进式训练,使模型能够根据问题的难易程度灵活切换思考模式,从而在简单问题上迅速响应,在复杂问题上则进行深入思考。这一创新使得整体模型的推理效率提升了8倍。

盘古深度研究工具DeepDiver同样表现出色。通过长链难题合成和渐进式奖励等关键技术,DeepDiver在网页搜索、常识性问答等应用场景中展现出了极高的执行效率。例如,它能够在5分钟内完成超过10条的复杂问答,并生成万字以上的专业调研报告,极大地提升了工作效率。

在大会上,张平安还分享了盘古大模型在计算机视觉CV、预测、多模态以及科学计算等基础模型方面的技术升级。这些升级不仅提升了模型的性能和准确性,还为农业、工业、科研等多个领域带来了丰富的创新应用和落地实践。盘古大模型正逐步成为行业AI领域的先锋力量,为解决行业难题提供了强有力的支持。

 
 
更多>同类内容
全站最新
热门内容