法国人工智能新兴势力Mistral近日宣布,正式涉足推理人工智能模型领域,并于6月10日推出了其首个推理模型系列——Magistral。这一举动标志着Mistral在人工智能领域迈出了重要一步,与OpenAI的o3模型和谷歌的Gemini 2.5 Pro等业界知名推理模型展开了竞争。
Magistral系列包含两个版本:Magistral Small和Magistral Medium。其中,Magistral Small拥有240亿参数,已在Hugging Face平台上以开源形式发布,采用Apache 2.0许可证。而Magistral Medium则是一个功能更为强大的模型,目前仍处于预览阶段,仅通过Mistral的Le Chat聊天平台、公司API及第三方合作伙伴云平台提供服务。
Mistral在官方博客中表示,Magistral系列模型专为解决多步骤问题而设计,旨在提高数学、物理等学科领域的一致性和可靠性。这些模型经过精心微调,适用于结构化计算、程序化逻辑、决策树和基于规则的系统等多种企业级应用场景。同时,它们还能提供可追溯的思考过程,增强模型的可解释性。
成立于2023年的Mistral,是一家专注于前沿模型开发的人工智能实验室。除了Le Chat和移动应用程序外,Mistral还致力于开发一系列人工智能驱动的服务。凭借General Catalyst等风险投资机构的支持,Mistral已筹集超过11亿欧元(约合90.22亿元人民币)的资金。
尽管Mistral在资源方面颇具优势,但在推理模型开发领域,它仍落后于一些领先的人工智能实验室。从Mistral自己的基准测试结果来看,Magistral在GPQA Diamond和AIME等评估模型物理、数学和科学技能的测试中,表现不如Gemini 2.5 Pro和Anthropic的Claude Opus 4。同时,在流行的编程基准测试LiveCodeBench中,Magistral也未能超越Gemini 2.5 Pro。
然而,Mistral并未因此气馁。在其博客文章中,Mistral着重强调了Magistral的其他优势。据称,Magistral在Le Chat上的答题速度是竞争对手的10倍,并支持多种语言,包括意大利语、阿拉伯语、俄语和简体中文。这使得Magistral在处理多语言问题时具有更高的灵活性和适应性。
Mistral在文章中进一步指出,Magistral专为研究、战略规划、运营优化和数据驱动决策而设计。无论是执行多因素风险评估和建模,还是在约束条件下计算最优交付窗口,Magistral都能展现出卓越的性能。这使得Magistral成为企业在进行复杂决策时的有力助手。
值得注意的是,Magistral的发布正值Mistral推出“氛围编程”客户端Mistral Code后不久。此前,Mistral还发布了多个专注于编程的模型,并推出了面向企业的聊天服务Le Chat Enterprise。该服务提供了人工智能代理构建器等工具,并将Mistral的模型与Gmail、SharePoint等第三方服务进行了集成。这一系列举措进一步展示了Mistral在人工智能领域的实力和雄心。