中国电信广东公司与阿里云携手,在广东韶关数据中心集群成功部署了“粤港澳大湾区首个基于‘真武’芯片的万卡智算集群”。这一里程碑式的成果,标志着我国在智算领域实现了从芯片到云平台,再到模型应用的全链条自主研发,为区域科技创新注入了强劲动力。
该集群在技术创新方面表现卓越。通过采用卡间RoCE高性能组网和双平面多轨通信等前沿技术,集群的端到端网络时延被压缩至4微秒以内,网络峰值利用率更是突破了95%的大关。这一性能优势,使得集群能够轻松应对大模型训练过程中AllReduce、AlltoAll等超大流量通信需求,为千亿参数级大模型的预训练与推理任务提供了稳定可靠的支撑。
在生态兼容性上,“真武”芯片同样展现出了强大的实力。它全面适配了主流AI生态,自研软件栈与各类主流模型、框架、算子库及操作系统实现了高效对接。统一的编程接口设计,使得用户能够端到端地实现自主业务落地与扩展,大大降低了客户迁移成本,为AI技术的广泛应用奠定了坚实基础。
为了推动算力资源的普惠化,中国电信广东公司还创新性地推出了“广东电信算力超市”。该集群资源同步上线这一平台,通过集约运营模式,面向中小企业提供按卡、按小时计费的灵活算力零售服务。这一举措不仅降低了中小企业使用算力的门槛,还有助于提升区域整体算力资源的利用效率。未来,集群还计划持续扩容至十万卡规模,以更低成本、更高效率的服务惠及大湾区更多科研机构、企业及政务部门。











