在机器人产业智能化升级的进程中,数据问题已成为制约发展的核心挑战之一。3月28日,中关村论坛平行分论坛——2026中国科幻大会现场,北京石景山具身智能触觉及多模态感知数训创新中心正式揭牌成立。该中心由北京石景山科技创新集团有限公司联合他山科技共同打造,聚焦具身智能产业需求,明确了触觉感知、异构计算、自主无人数采三大技术方向,致力于构建覆盖多模态数据采集、算法训练、场景落地的全流程技术转化平台。
中关村论坛"百亿具身智能对话"环节中,星动纪元联合创始人席悦指出,当前具身智能发展的最大瓶颈在于数据获取。真实场景下的数据采集面临多重障碍:场景方开放权限的意愿有限,大规模采集存在成本高、周期长的问题,而现有替代方案如1:1复刻真实场景的自建训练场模式,因过度依赖工程师全程参与采集、训练、部署及问题定位,导致整体效率低下且成本居高不下。
针对这些痛点,席悦提出两项解决方案:一是构建"数据采集-模型迭代"的闭环数据飞轮,使机器人能在真实环境中自主处理极端情况,持续提升系统效率;二是推进"人类演示+真机采集"的组合模式,但需突破本体构型、运动形态、感知方式等方面的差异障碍。原力灵机创始人唐文斌则认为,数据采集本质是资金与时间投入问题,通过购置机器人、建设训练场、雇佣遥操作人员等手段可快速积累数据量,但真正形成竞争优势的关键在于企业能否实现真实场景数据的自动回流,并搭建高效的数据飞轮闭环。
智平方联合创始人张鹏强调,尽管公司已具备多种数据获取途径,但真实场景数据的价值无可替代。通过一线部署产品实现数据回流与沉淀,是当前行业最宝贵的数据资产。在保障安全的前提下,智平方会与客户共享这部分数据。据悉,北京石景山人形机器人数据采集训练中心四期项目已与乐聚、他山、睿尔曼、灵初等企业展开合作,重点破解数据短缺与质量瓶颈问题。
一位行业人士分析称,当前具身智能领域正经历数据体系重构。无本体数据技术(如第一人称视角的EGO方案、通用操作接口的UMI方案)的兴起,使传统依赖重资产投入的遥操作数据采集工厂面临发展困境。从数据价值维度看,真实场景数据仍是机器人模型训练的"金字塔尖"资源,但行业普遍存在两大核心问题:一是数据质量与管线设计缺乏标准化;二是数据处理能力存在显著行业差距,多数厂商不具备搭建高效数据处理体系的技术实力,且缺乏统一的技术诀窍共享机制与基准评测体系,导致数据应用效率参差不齐。
该人士进一步指出,若EGO、UMI等无本体数据技术实现普及,将进一步凸显场景资源的稀缺性。企业可能摆脱对传统数据采集工厂的依赖,直接在真实场景中完成数据采集,场景的可及性与多样性将成为数据竞争力的关键变量。从技术迭代趋势看,具身智能需要亿级小时级的训练数据,当前总量仍严重不足,但部分与主流技术路线错位的核心资产(如依赖机器人本体、固定场地的重资产中心)可能面临产能利用率下滑、单位成本飙升的风险。长期来看,数据领域的竞争逻辑将从硬件比拼转向真实场景获取能力、场景与数据闭环迭代效率等维度。










