发现商业评论 旗下
洞察商业 启迪未来

成本与效率驱动新风向:AI创业者转向设备端轻量化模型赛道

   时间:2026-01-10 12:15 来源:快讯作者:陈丽

曾经,“百模大战”是AI创业领域的关键词,从通用大模型到行业模型,参数规模不断突破,融资金额持续攀升,市场一度形成“不做大模型就会被淘汰”的强烈共识。然而,如今风向已悄然转变,无论是在硅谷还是国内创投圈,单纯以“打造大模型”为核心卖点的创业项目热度迅速下降,轻量化小模型、AI Agent以及设备端(On-Device)AI等方向正成为新的热门赛道。

这一转变并非技术热情的消退,而是成本、商业化和资本逻辑共同作用下的理性回归。在2026年的国际消费类电子产品展览会(CES)上,这一趋势尤为显著。设备端AI创业公司Aizip的联合创始人陈羽北在接受采访时表示,设备端AI正成为创业公司竞相涌入的新赛道。陈羽北是典型的在美华人工程师,拥有清华大学学士和加州大学伯克利分校博士学位,目前还在加州大学戴维斯分校任教并开展创业项目。

陈羽北介绍,设备端AI通过“用大模型生成小模型”的方式,利用收集数据、购买数据和大模型蒸馏三种途径获取所需数据,让AI能够直接在终端设备上运行,无需依赖云端或网络。这种模式不仅降低了成本,还保障了数据隐私,使智能应用能够快速落地。目前,Aizip的设备端AI模型已在多个终端品牌实现应用,并与软银、ARM、Microchip等全球多家头部硬件厂商展开合作。

2025年12月,OpenAI首席执行官山姆·奥特曼发出“红色警报”,要求公司加速推进ChatGPT相关工作,推迟其他产品开发,以应对谷歌Gemini3等对手的竞争压力。尽管大模型领域的竞争愈发激烈,但进入该赛道的竞争者数量却在减少,行业逐渐形成共识:大模型之战将成为资本雄厚的巨头之间的争夺。

多位参与CES的风投圈人士和AI企业创业者表示,大模型已成为高度资本密集型的竞赛。千亿参数模型的单次训练成本高达数千万美元,推理阶段的算力消耗同样惊人。随着GPU价格居高不下、云算力账单持续攀升,大模型的“边际成本”并未如预期般快速下降。对于创业公司而言,这意味着资金消耗速度远超传统软件创业,且即便模型性能提升,商业化路径仍充满不确定性。多位投资人私下直言,大模型项目正成为“技术可行,但财务模型难以自洽”的典型案例。

在此背景下,更多资本和AI创业者将目光转向轻量化模型和AI Agent,Aizip便是其中之一。尽管大模型缩放定律(即训练数据和模型参数越大,模型智能越强)仍然有效,但AI从业者也意识到,不应盲目追求算力。陈羽北回忆,博士毕业后,他意识到自己在工程能力上存在短板,于是加入Yann LeCun的团队,在Facebook AI Research以及纽约大学从事博士后研究,这段经历帮助他补齐了模型工程化与规模化模型训练的能力。

“当时,我们能够直接使用配备512张V100显卡的大规模算力进行训练。写一篇论文消耗的计算资源可能就要花费上百万美元。Scaling确实有效——更多的数据、更大的模型以及更直接的优化通常能带来性能提升,但并非总是成正比。”陈羽北说。例如,数据规模扩大300倍,模型性能可能仅提升个位数的百分点。这让他开始反思数据质量、模型结构、工程严谨性等因素的实际影响。近年来,许多AI创业公司盲目推高模型规模,资源已用到极限,却很难再从缩放中获得突破。因此,陈羽北认为,要尊重缩放定律,但不能迷信它。“特别是在创业时,我们的思路是反向的——不是追求更大,而是打造‘全球最小、最高效’的AI系统。这与主流强调通用人工智能(AGI)、取代人的方向并不一致。”

设备端AI正是在这样的背景下成为全球AI界热门的新兴方向。简单来说,设备端AI直接在手机、笔记本、相机等设备上运行,不依赖云端或互联网。其特点在于轻量化模型适合本地处理少量数据,响应速度快、延迟低,且数据不出设备,安全性更高。例如,手机拍照的自动美颜和夜景增强功能、iPhone上的Siri或照片识别功能、智能门锁或家用机器人的语音和图像处理功能等。

陈羽北介绍,Aizip本质上是一家纯软件公司,专注于AI模型的研发,在大模型的基础上训练、生成适合各种垂直场景的小模型。同时,创业团队对硬件有深入理解,联合创始人过去创立的公司曾服务于Apple等客户。“设备端AI模型的训练主要通过收集数据、购买数据和大模型蒸馏三种途径,同时要评估数据合规性,使用高质量的产品级数据。”他表示,尽管目前专注于本地化智能赛道,但也会对标Gemini等优秀模型,在细分应用上追求达到或超越其性能,可利用视觉语言模型(VLM)。尽管缩放定律仍然有效,但在需求明确的应用上,大模型的缩放定律可能会逐步失效。

据观察,当前卡拉OK声音解决方案、智能摄像头、智能唤醒助手三类应用场景的商业化前景尤为突出。以卡拉OK声音解决方案为例,传统卡拉OK或在线唱歌应用中,用户只能使用原版伴奏或在线处理,而端侧解决方案能够直接在用户设备上完成声音分离,识别并消除歌曲中的人声部分,只保留背景音乐,无需上传歌曲到云端或依赖在线计算。

再以智能摄像头为例,端侧识别与安全报警功能具备商用潜力。AI解决方案使摄像头能够在设备端完成复杂的图像识别任务,例如区分来访人员身份(是快递员还是潜在偷取快递的陌生人),并实时提醒无法全程监控环境的用户。如果识别到异常行为,摄像头能够自动发出报警信号,提示用户采取措施。这种模式对家庭、社区和物流企业而言,具备实时性、安全性和隐私保护的三重优势,用户无需担心摄像头数据被传到云端或被第三方访问。

陈羽北坦言,目前真正的设备端AI革命尚未到来,但市场热度比之前更高,从产品化、落地和客户需求来看,进入真实产品场景的数量正在增多。未来发展的关键在于更多刚需应用的出现,如智能手表的语音能力、婴儿监控摄像头等,这些应用能够培养用户习惯,且注重隐私保护,将AI能力放到本地。

他还提到,当前行业对AI模型训练人才和算力的需求依然极高,华人工程师在AI浪潮中扮演了关键角色。这源于他们的优势——数理基础好、工作努力、学习新技术速度快、解决工程类问题能力强,在既定赛道发展较快。相比之下,美国顶尖工程师也有自己的特长,他们的思想更自由,更敢于打破常规想象,在创造新路线方面更具创新思考能力。

 
 
更多>同类内容
全站最新
热门内容