全球开发者社区近日因一款匿名上线的大模型掀起热议,这款被外界猜测为DeepSeek V4的"隐身模型"最终被小米揭晓真实身份。3月19日凌晨,小米正式发布MiMo大模型系列三款新品,包括旗舰基座大模型MiMo-V2-Pro、全模态Agent模型MiMo-V2-Omni及语音合成模型MiMo-V2-TTS。创始人雷军同步宣布,小米万亿参数大模型已投入应用,并透露今年AI领域研发投入将突破160亿元。
此次发布的MiMo-V2-Pro以1.05万亿总参数、420亿激活参数的规模跻身全球大模型前列。该模型在Artificial Analysis Intelligence Index榜单中位列全球第八、中国第二,超越xAI Grok等竞品,仅次于GPT-5.4等头部模型。其100万token的超长上下文窗口和7:1混合注意力机制设计,使其在复杂推理任务中表现突出,在OpenClaw评测中取得全球顶尖成绩。成本效率方面,该模型完成智能测试的成本较GLM-5低36%,较Claude系列模型最高降低90%,展现出显著优势。
全模态模型MiMo-V2-Omni整合了图像、视频、音频处理能力与智能体功能。高盛研究报告显示,该模型在音频理解、视频分析等核心指标上达到或超越Gemini 3 Pro、Claude Opus 4.6等国际领先水平。语音合成模型MiMo-V2-TTS则聚焦多粒度风格控制与自然韵律复现,未来计划扩展多语言支持并与Omni模型深度融合,使智能体具备更接近人类表达能力的语音交互功能。
技术突破背后是小米自研训练系统的支撑。最新推出的ARL-Tangram系统使模型训练效率显著提升,平均动作完成时间缩短至原来的1/4.3,强化学习训练速度最高提升1.5倍,外部资源消耗最高减少71%。这些优化直接降低了大模型研发成本,为持续迭代奠定基础。
三款模型已快速落地至小米生态产品。WPS Office、小米手机/电脑搭载的miclaw智能体系统及小米浏览器均完成集成,形成覆盖办公、移动、浏览场景的AI应用矩阵。同步推出的辅助驾驶系统HAD搭载XLA认知模型,整合跨具身基础模型MiMo-Embodied,标志着小米"人车家"生态进入智能体深度协同阶段。
高盛分析指出,小米正从AI研发投入期转向成果转化期。今年2月发布的机器人视觉-语言-动作模型Xiaomi-Robotics-0,与此次发布的三款模型形成技术协同。该机构预测,MiMo-V2-Pro将向高复杂度推理进化,Omni模型将实现跨天级持续意图规划,TTS模型则向多语言深度融合发展。这些迭代方向将巩固小米在物理AI领域的领先地位。
资本市场对小米AI战略给予积极回应。高盛维持"买入"评级,将12个月目标价定为41港元,较当前股价存在约14%上行空间。尽管预测2026年研发支出将达400亿元导致短期利润承压,但该机构认为市场将重新评估小米价值——作为同时掌握自研AI、操作系统和芯片能力的物理AI领导者,其生态优势与终端落地能力将创造差异化竞争优势。










