在人工智能领域,小参数模型正成为新的焦点。Qwen团队近日推出基于Qwen 3.5架构的小尺寸模型系列,包含0.8B、2B、4B和9B四个版本,引发行业广泛关注。特斯拉创始人马斯克在社交平台X上点赞该发布,并评价其"智能密度令人印象深刻"。这一评价背后,是Qwen 3.5在性能与效率上的突破性表现——仅9B参数的模型在FBench和GPQA Diamond等复杂推理测试中,成绩与参数规模达1200亿的GPT-OSS-120B持平。
智能密度作为衡量模型效率的核心指标,指的是单位参数规模或算力消耗下模型展现的逻辑推理与任务处理能力。Qwen 3.5采用原生多模态架构,使小参数模型也能支持视觉任务处理。这种技术突破让4B、9B版本在保持轻量化的同时,具备图像识别、文字翻译等跨模态能力,直接挑战了传统认知中"大模型即强模型"的观念。
在巴塞罗那举行的MWC展会上,Qwen与骁龙合作展示的智能眼镜成为焦点。这款搭载端侧Qwen模型的设备在离线状态下仍能完成复杂问答和图像翻译任务,现场体验者对其响应速度和准确性给予高度评价。该应用场景印证了小参数模型在终端设备上的巨大潜力——既解决隐私担忧,又避免流量消耗,同时不影响设备基础性能。
行业观察人士指出,Qwen的开源策略具有战略意义。当前AI市场虽不乏顶尖模型,但像Qwen这样持续发布全尺寸模型并开源的厂商极为罕见。其技术路线不仅激活了阿里自身AI生态,更成为全球开发者的重要基础设施。当被问及"最强开源模型"时,多数从业者会指向Qwen,这种行业认可度源于其技术普惠性与生态开放性。
马斯克对Qwen小参数模型的关注,折射出行业趋势的转变。在移动设备、PC及具身智能领域,2B-4B级别的模型正成为主流选择。这类模型可直接部署于手机端侧,在保障基础功能运行的同时提供智能服务。对于具身智能设备而言,多模态小参数模型能平衡续航、响应速度与场景适应性,使机器人摆脱云端依赖,获得真正的自主行动能力。Qwen的技术路径恰好为Optimus等机器人项目提供了可参考的解决方案。
值得注意的是,Qwen核心负责人林俊旸在发布小参数版本后宣布离职,引发开源社区对后续研发方向的讨论。业界普遍关注Qwen 4是否会延续小参数路线,毕竟这一技术方向已渗透到智能硬件、物联网等多个领域,影响着数百万开发者的技术选型。在MWC展会上,AI与通信技术的融合成为新主题,5G-A/6G网络为端侧智能提供了算力支撑,而Qwen等模型则解决了应用层的效率难题,这种协同效应正在重塑智能设备的未来图景。











