发现商业评论 旗下
洞察商业 启迪未来

阿里通义千问3问鼎全球开源模型测评,超越顶级闭源模型!

   时间:2025-05-06 16:07 来源:华尔街见闻作者:华尔街见闻

在最新发布的国际大模型权威测评榜单LiveBench上,阿里巴巴的开源新作——通义千问模型Qwen3,以其卓越表现摘得了全球开源模型的桂冠。不仅如此,Qwen3在指令遵循这一核心能力的比拼中,更是力压o3High、o4-MiniHigh以及Gemini2.5pro等多款顶尖闭源模型,荣登榜首。

LiveBench榜单由meta首席AI科学家、图灵奖得主杨立昆(Yann LeCun)携手纽约大学等权威机构共同推出,旨在通过数学、推理、编程、语言理解等多个复杂且全面的维度,对大模型的能力进行精准评估。这一榜单因采用实时更新的题库,确保了测试的公正性和真实性,被誉为“全球首个无法作弊的模型基准测试”。

Qwen3此次的夺冠,不仅是对其技术实力的有力证明,也标志着阿里巴巴在大模型研发领域取得了重大突破。在全球科技竞争日益激烈的当下,Qwen3的出色表现无疑为中国科技企业在国际舞台上赢得了更多关注与尊重。

值得注意的是,Qwen3在指令遵循能力上的超越,不仅体现了其强大的理解和执行能力,也为其在更多应用场景中的广泛应用奠定了坚实基础。从智能家居到自动驾驶,从智能制造到智慧城市,Qwen3都有望成为推动这些领域智能化升级的重要力量。

随着人工智能技术的不断发展和普及,大模型作为其中的关键一环,正逐渐成为推动社会进步和产业升级的重要驱动力。而Qwen3的夺冠,无疑将为中国乃至全球的大模型研发和应用带来更加广阔的发展前景。

LiveBench榜单的推出和不断更新,也为全球大模型研发者提供了一个公平、公正的竞争平台。通过这一平台,不仅可以更直观地了解各款大模型的优势和不足,还可以为未来的技术研发和应用提供有力参考。

 
 
更多>同类内容
全站最新
热门内容