发现商业评论 旗下
洞察商业 启迪未来

Meta闭源转型:Muse Spark携“思维压缩”技术强势入局AI新赛道

   时间:2026-04-10 19:21 来源:天脉网作者:朱天宇

meta全新大模型Muse Spark的上线,让科技圈再次沸腾。这款内部代号“Avocado”的模型,不仅是meta超级智能实验室(MSL)成立9个月后的首个成果,更被视为扎克伯格在经历Llama 4风波后,以140亿美元重组战略后的首张答卷。与以往高举“开源对抗闭源”大旗不同,meta此次为Muse Spark贴上了“闭源”标签,API仅向少数合作伙伴开放预览,这一策略转向引发广泛讨论。

Llama 4的失败曾让meta陷入信誉危机。基准测试数据造假、公开版本与“特供版”性能差距巨大等争议,导致图灵奖得主Yann LeCun离职后都承认测试结果“修饰过度”。这场风波彻底激怒了扎克伯格,他直接架空生成式AI团队,并启动了一场彻底的组织变革。2025年夏天,meta以143亿美元收购数据标注巨头Scale AI 49%股份,并将年仅29岁的华裔创始人Alexandr Wang引入核心管理层,组建MSL实验室。这支由浙大校友毕树超、清华校友赵晟佳、中科大校友于佳慧等7位华人研究员领衔的“亿元天团”,目标只有一个:从零开始重塑meta的AI版图。

资本市场的反应印证了Muse Spark的分量。发布当日,meta股价盘中暴涨超10%,最终以6%涨幅收盘,市值稳居1.55万亿美元高位。这种市场热情源于模型展现的颠覆性潜力——在医疗和视觉多模态领域,Muse Spark展现出碾压级优势。在医学开放式问答评测HealthBench Hard中,它以42.8分远超GPT-5.4的40.1分和Gemini 3.1 Pro的20.6分;科研图表理解测试CharXiv Reasoning中,86.4分的成绩同样领先对手。这些突破得益于meta与超1000名医生合作整理的训练数据,相当于为模型配备了“顶级专家智囊团”。

实际应用场景中,Muse Spark的“视觉天赋”更令人惊叹。拍摄食物照片即可分析卡路里,识别瑜伽动作并纠正姿势,甚至能操作咖啡机——这些功能让外界开始畅想它与AI眼镜结合的可能性。不过,模型在逻辑推理和代码编程方面的短板同样明显:ARC AGI 2测试中42.5分的成绩,仅为Gemini 3.1 Pro(76.5分)的一半;软件工程实测通过率52.4%,也低于GPT-5.4的57.7%。这种“偏科”特性,暴露出meta当前的技术取舍——优先攻克垂直领域,暂不追求全能模型。

真正让行业震撼的,是meta公布的技术栈重构数据:Muse Spark达到Llama 4同等性能所需的计算量减少超一个数量级。这种效率跃升源于MSL团队开发的“思维压缩”技术——通过引入“思考时间惩罚”机制,模型被迫用更短的逻辑链条解决问题,准确率却不降反升。配合多Agent并行推理的“沉思模式”,Muse Spark在Humanity‘s Last Exam评测中以58%的成绩击败GPT-5.4 Pro(43.9%)和Gemini Deep Think(48.4%)。扎克伯格在社交媒体直言,这不仅是智能助手,更是“个人超级智能领域的新物种”。

从Llama 4的舆论泥潭到Muse Spark的强势回归,meta仅用9个月就完成了一场技术自救。这支由华人科学家主导的团队,用闭源策略和垂直领域突破,重新将meta推入与OpenAI、谷歌的顶级竞争行列。尽管编程能力和抽象推理仍有待提升,但Muse Spark已证明:在AI军备竞赛中,更聪明的训练方式,可能比堆砌算力更具颠覆性。

 
 
更多>同类内容
全站最新
热门内容