发现商业评论 旗下
洞察商业 启迪未来

从仿真到现实:Sharpa如何让机器人灵巧手拥有“手感”跨越虚实鸿沟

   时间:2026-03-23 16:56 来源:快讯作者:朱天宇

在机器人技术领域,如何让机械灵巧手拥有类似人类的触觉感知与精细操作能力,一直是科研人员攻克的重点方向。初创公司Sharpa凭借其创新性的技术路径,为这一难题提供了全新解法,仅用一年多时间便探索出从仿真建模到分层控制的实践路径。

Sharpa推出的Wave灵巧手集成22个主动自由度,与人手比例达到1:1,配备高分辨率触觉传感器,兼具动态响应能力与友好开发环境。这款产品为机器人灵巧操作及高质量具身数据采集开辟了新可能,但随之而来的挑战同样显著:数据采集复杂度陡增、视觉与触觉模态竞争加剧、计算开销大幅上升。若选择夹爪与纯视觉技术路径,虽能快速完成特定任务演示,却会面临未来范式转移与硬件重构的双重困境。

面对技术瓶颈,Sharpa选择了一条更具挑战性的道路——将触觉灵巧手作为核心工具,通过分层计算架构解锁新方法。其提出的"分级动作生成"策略巧妙复刻人类肌肉记忆:以"伸手取水杯"为例,系统先通过视觉引导手臂接近目标并调整手掌姿态,待接触发生后,触觉与本体觉立即接管控制权,完成捏、转、提等精细动作。这种"先视觉定向,后触觉微调"的分级模式,既符合物理交互直觉,又大幅降低计算负担,使AI无需全程依赖视觉算力。

从生成式概率模型视角审视,该策略可理解为两级条件概率漏斗的协同运作:视觉主导的初级漏斗负责生成粗略动作与整体意图,触觉主导的次级漏斗则结合实时手感信息生成精细动作。这种设计暗合人类神经系统分级构造,通过多级协同实现熵减与动作生成。基于此认知,Sharpa构建了由System 2、System 1、System 0组成的三重系统架构。

System 2作为逻辑推理中枢,将复杂任务拆解为语义明确的子任务;System 1扮演规划师角色,结合视觉观察输出物理含义的粗动作轨迹;System 0则作为紧贴物理世界的执行者,通过触觉与本体觉反馈实现高频精细控制。这种架构设计巧妙平衡计算开销与实时控制需求:推理频次最高的System 0采用极小模型规模,确保100Hz级高频反馈;规模庞大的System 2在后台低频运转,避免算力浪费。同时,每级系统设定绝对主导感知模态,有效缓解模态冲突问题。

作为系统核心的System 0采用流匹配模型,以delta动作(关节角或关键点调节量)为输出,通过极致简化设计实现推理速度突破:模型参数压缩至极限,流场ODE解算步骤大幅削减,观测帧数控制在5帧以内。这种短程、高频的实时控制设计,使其既能与System 1协同完成自主任务,也可单独对接遥操作设备进行数据采集。在"手内重定向"与"双指搓球"实验中,接入System 0的机器手展现出惊人稳定性,能自动过滤操作抖动并维持受力平衡,仿佛具备磁吸效应。

触觉规律的数字化建模是系统实现的关键突破。Sharpa团队在NVIDIA Isaac Sim中构建高精度数字孪生,通过凸包技术优化几何计算,并开发专用插件模拟弹性体形变。实验数据显示,该方案接触点误差小于1毫米,受力误差控制在0.5牛以内,形变重合度超85%。在强化学习阶段,团队采用PPO算法训练教师策略,将力学常识编码为奖惩机制,再通过策略蒸馏剥离仿真特权信息,使学生策略可直接零样本部署至真实机械手。

这种仿真生成与真机微调相结合的闭环路径,有效解决了具身智能落地的数据困境。预训练的System 0级联遥操作设备后,数据采集效率与质量显著提升,还能实现异地人机协同;接入System 1的高层认知模块后,系统可从互联网视频中提取任务规律,形成完整的控制闭环。面对Sim2Real挑战,高保真物理建模与生成式AI的闭环鲁棒性构成双重保障:前者基于硬件特性针对性建模实现零样本迁移,后者通过概率生成机制持续响应误差,自然消化部分仿真到现实的偏差。

 
 
更多>同类内容
全站最新
热门内容