从会跳舞到有感知,触觉是机器人通往智能的门票吗?| S10E19

2026-07-01 · Show: What's Next|科技早知道 · 3156s · Source

从会跳舞到有感知,触觉是机器人通往智能的门票吗?

概览

本期围绕机器人触觉展开,嘉宾是一目科技创始人兼 CEO Eric 李志强。讨论从一个核心问题出发:机器人已经有视觉、激光雷达和运动控制,为什么还需要触觉?

嘉宾认为,视觉在灵巧操作中存在精度不足、遮挡和缺少力觉三大限制;而触觉能补上机器人理解物理世界时最关键的近场反馈。节目把触觉放进具身智能的大框架中讨论,认为移动能力已较成熟,灵巧手仍未完全收敛,而“大脑”对物理世界的理解仍然薄弱。

后半部分重点讨论光触觉/视触觉技术路线、触觉数据如何进入模型、真机数据与仿真数据的配比、工业场景的落地路径,以及一目科技在芯片、材料、算法和数据上的投入。嘉宾的核心判断是:触觉不是锦上添花,而是机器人进入人类物理世界的关键基础设施。

分段落总结

[00:13] 开场与嘉宾背景

[事实] 主持人介绍本期节目讨论机器人触觉,这是具身智能领域重要但经常被忽略的话题。 [事实] 嘉宾 Eric 李志强是一目科技创始人兼 CEO,节目中主要分享触觉传感器和触觉算法相关内容。 [事实] Eric 提到自己本科读计算机和环境工程,后来在 CMU 读博士,研究过 AI 在环境工程中的应用、微流控传感和硅光感知芯片。

[02:16] 为什么机器人需要触觉

[事实] 嘉宾认为视觉有三个主要问题:精度不够、容易被遮挡、无法提供力觉。 [事实] 在灵巧操作中,视觉精度可能只有几十毫米到几毫米,难以支撑非常精细的动作。 [事实] 当机器人拿杯子或苹果时,物体后半部分会被遮挡,视觉无法判断手是否接触、接触力有多大。 [事实] 嘉宾用手部麻醉和戴厚手套的例子说明,缺少触觉会让扣扣子、穿针引线等精细动作失灵。 [事实] 节目中提到,行业对触觉数据和触觉模态越来越关注,触觉被视为具身智能的重要拼图。

[05:06] 具身机器人能力现状打分

[事实] 嘉宾把机器人移动能力打到约 90 分,认为跳舞、翻跟头等运动能力已非常接近成熟。 [事实] 嘉宾认为灵巧手仍在 60 分以下,原因是技术路线尚未完全收敛,高自由度方案还需要迭代。 [事实] 嘉宾把机器人“大脑”打到约 30 分,认为模型对物理世界的信息仍然太少。 [事实] 节目中提到,大语言模型可以“读万卷书”,但物理 AI 需要“行万里路”,包括触摸、理解物体的软硬和空间关系。 [推测] 在嘉宾看来,机器人短板已从单纯机械运动转向物理感知、泛化和模型理解。

[08:00] Demo 不等于真正泛化

[事实] 主持人提到机器人拿鸡蛋、剥鸡蛋壳等 demo,询问这是否说明触觉已达到高水平。 [事实] 嘉宾认为触觉能力可能在 45 到 50 分左右,比大脑更收敛,但仍未成熟。 [事实] 嘉宾强调,预编程 demo 不代表具身智能,关键要看能否泛化到鹌鹑蛋、鸵鸟蛋、香蕉、橘子等不同对象。 [事实] 嘉宾认为真正的具身智能需要实时力反馈,也需要在出现误差时能够调整。

[09:19] 触觉技术路线与光触觉

[事实] 嘉宾提到历史上触觉技术路线包括电磁式、压阻、电容等,现在行业逐渐收敛到视触觉或光触觉方案。 [事实] 嘉宾解释,视触觉本质上是触觉,不是普通视觉;它通过表面皮肤接触物体后的形变和光影变化,反推力和纹理反馈。 [事实] 嘉宾认为“光触觉”这个名称更准确,因为它是通过光子探测皮肤形变,再转化为力分布和纹理信息。 [事实] 嘉宾认为视觉和触觉不是互斥关系,而是互补关系;视觉无法解决精度、遮挡和力控问题。

[12:00] 类人触觉的指标门槛

[事实] 嘉宾认为具身智能追求的是类人能力,因此触觉传感器也应参照人的触觉能力。 [事实] 嘉宾提到人的一个指尖大约有 3000 个触觉点位,每个点位有 4 类受体神经,相当于约 12000 个受体神经。 [事实] 嘉宾认为触觉传感器至少需要万点以上的触觉点,传统路线可能只能做到每平方厘米约 10 个点。 [事实] 嘉宾强调,触觉还需要感知软硬、粗糙光滑、纹理、摩擦和滑动,这些都与真实抓握有关。 [事实] 嘉宾举例说,同样一个杯子,有水和没水需要不同抓握力;没有触觉,杯子可能会滑落。

[15:13] 光触觉能复刻多少人类触觉

[事实] 嘉宾认为传统路线对人类触觉能力的复刻可能不到 10%。 [事实] 嘉宾称光触觉在力灵敏度、纹理、摩擦、正向力和密度等指标上已经接近人类,甚至部分超越。 [事实] 嘉宾也承认光触觉仍有缺陷,包括温度感知仍在迭代、响应速度与人类极限反应仍有差距。 [事实] 嘉宾提到其触觉传感器大约 8 毫秒一次响应,而人类某些精确控制可以更快。 [推测] 光触觉已经覆盖了大量常见触觉需求,但距离完整复刻人体触觉仍有工程和生理层面的差距。

[16:33] 为什么说今年是触觉拐点

[事实] 嘉宾认为“触觉元年”背后应看三层含义:是否有价值、技术是否成熟、成本和可行性是否成熟。 [事实] 嘉宾认为今年行业在价值层面已经形成共识,触觉被认为需要装到机器人灵巧手上。 [事实] 嘉宾判断,做 VLA、World Model 等模型的人已经感受到视觉和语言模态的天花板,开始意识到缺少触觉会影响落地。 [事实] 嘉宾提到 Figure、Meta、Google、特斯拉等公司都在关注或推进视触觉方向。 [事实] 嘉宾称一目科技的产品在质量、稳定性、一致性和性能上已接近量产准备阶段。

[20:18] 成本可行性与摩尔定律

[事实] 嘉宾称一目科技的触觉传感器可以做到每平方厘米 20 多万个点,而人类约 1.2 万个点,其他触觉路线约 10 个点。 [事实] 嘉宾认为视触觉带来的感知收益很大,但成本只提升百分之几十,因此投资回报率高。 [事实] 嘉宾认为光触觉传感器底层依赖芯片、光学和材料,长期可能受益于类似摩尔定律的成本下降趋势。 [推测] 嘉宾把光触觉看作一种可以规模化降本的硬件平台,而不是短期高价的小众传感器。

[21:27] 开源、仿真与 TouchNet

[事实] 主持人提到一目科技与英伟达等公司合作,并把部分视触觉能力开源出来。 [事实] 嘉宾表示,一目科技希望开放仿真软件平台,未来也开放部分触觉数据。 [事实] 嘉宾提到公司正与斯坦福等机构合作,计划做类似 ImageNet 的触觉数据集,称为 TouchNet。 [事实] 嘉宾认为 ImageNet 推动了视觉 AI 的发展,因此触觉也需要高质量数据集来推动行业发展。

[22:51] 触觉如何进入模型系统

[事实] 主持人提出机器人系统中有“大脑”“小脑”、System 1/System 2 等分层,询问触觉如何整合进去。 [事实] 嘉宾提到 VLA 可能演进到 VTLA,其中 T 指 Tactile,即触觉。 [事实] 嘉宾认为触觉可以通过类似视觉和语音的 encoder 接入 Transformer 体系。 [事实] 一目科技正在研发 Tactile Transformer Encoder,用于把触觉信息编码成模型可理解的语义信息。 [事实] 这个 encoder 会先判断软硬、光滑粗糙、物体类别等,再与视觉模态对齐,输入到 backbone 大模型中。

[25:57] 触觉数据的三个特点

[事实] 嘉宾认为触觉数据处理需要更快,因为触觉反馈常常需要实时反应。 [事实] 嘉宾说触觉数据相对准确,接近 ground truth,因为它直接反映力和形变。 [事实] 嘉宾认为触觉数据量相对视觉更小,因此前端小模型可以更快处理。 [事实] 嘉宾强调触觉是高频连续信号,例如判断摩擦和粗糙度需要时间维度上的连续反馈。 [推测] 触觉模型不能简单复制视觉模型范式,需要面向低延迟、高频连续反馈设计。

[28:53] 触觉模型的三大难点

[事实] 嘉宾认为触觉模型第一个难点是缺少前人数据遗产,触觉数据库少,开源数据质量和规模都不足。 [事实] 嘉宾指出触觉概念的物理定义也不清晰,例如“光滑”“粗糙”“软”“硬”的阈值难以统一。 [事实] 嘉宾认为第二个难点是触觉与视觉、听觉等其他模态的对齐。 [事实] 嘉宾认为第三个难点是如何整合不同频率的数据,尤其是触觉的高频连续信号与视觉、音频之间的差异。 [推测] 触觉数据集建设不仅是采集问题,还涉及标注标准、物理量定义和多模态时间同步。

[30:24] 真机数据、仿真数据与视频预训练

[事实] 主持人提到机器人数据金字塔:真机数据最珍贵,其次是仿真或合成数据,再往下是动捕和视频数据。 [事实] 嘉宾认为真机数据最好,但太贵、太难获得、量太小,可能只占 10% 到 20%。 [事实] 嘉宾更倾向于接近人实际操作的无本体真机数据,而不是完全通过遥操作机器人得到的数据。 [事实] 嘉宾称一目科技投入很多资源做仿真平台,并在仿真平台中接入光触觉模态。 [事实] 嘉宾提到一种新的思路:预训练阶段可以用少量真机数据、中量仿真数据和大量视频数据,让模型先形成视觉预判。

[33:37] 数据飞轮与落地节奏

[事实] 嘉宾用特斯拉 FSD 举例,认为车辆一边使用、一边收集数据、一边训练模型,会形成数据飞轮。 [事实] 嘉宾认为机器人也应先训练出一个约 80 分的模型,在不危险的场景中使用,再通过强化学习和后训练继续提升。 [事实] 嘉宾认为家用机器人“进家”还较远,因为涉及模型成熟度、安全性和责任问题。 [事实] 嘉宾认为第一阶段更可能先落在智能制造工厂,例如打螺丝、插拔线束和其他依赖老师傅手感的工艺。 [推测] 工业场景因边界更清晰、安全风险更可控,可能比家庭场景更适合触觉机器人率先形成数据飞轮。

[36:10] 触觉不是 nice to have

[事实] 主持人质疑触觉是否只是锦上添花,因为它过去没有大规模量产应用。 [事实] 嘉宾认为现在这类质疑已经少了,因为许多自动化无法替代的工序本质上依赖触觉。 [事实] 嘉宾举汽车工厂整机组装为例,许多车间自动化程度高,但整机组装仍有大量工人。 [事实] 嘉宾称传统工业机器人无法完成某个电池包插拔组装任务,一开始具身智能方案需要 100 秒,后来做到 50 秒,再到 15 秒,而人工约 30 秒。 [事实] 嘉宾认为机器人可以 24 小时训练,随着学习收敛,速度可能继续提升。

[39:07] 工业与医疗中的手感问题

[事实] 嘉宾把电池包插拔类比为开钥匙或装卡扣,需要“咔”的手感,很难用语言精确表达。 [事实] 主持人举医学穿刺例子,说明医生需要通过手感判断穿过皮肤、脂肪层、腹膜层等不同层次。 [事实] 嘉宾回应称一目科技也在与医学方向合作,穿刺和精细外科操作都需要触觉和力反馈。 [事实] 嘉宾认为现有手术机器人多是遥操作,真正自动完成精细医疗操作仍需要触觉和力反馈。 [事实] 嘉宾引用团队文案称,触觉不是一个传感器,而是机器人进入人类物理世界的一张门票。

[41:01] 从机械臂到人形机器人的市场路径

[事实] 嘉宾表示当前重要客户场景仍包括机械臂,而不只是人形机器人。 [事实] 嘉宾认为终局可能是人形机器人,但在过程中,非人形、装了大脑的机器人也会有很大市场。 [事实] 嘉宾提到协作臂或机械臂市场保有量大约上千万台,每年新增几百万台,若升级为带大脑和反馈控制的系统,市场规模可能很大。 [事实] 嘉宾认为数据采集和传统工业机械臂升级改造都是很好的业务方向。 [推测] 工厂里的专业场景数据未来可能迁移到家庭中的类似动作,例如插拔线束经验迁移到给电器或手机充电。

[42:47] 一目科技的差异化

[事实] 嘉宾认为一目科技的特点是跨多学科自研能力,包括芯片、材料、光学、仿真和 AI 算法。 [事实] 嘉宾称触觉传感器底层是感光芯片,一目科技自研超表面硅光感光芯片,从而把传感器厚度压缩到约 10 毫米,而许多友商是 30 多毫米。 [事实] 嘉宾强调材料学也很关键:材料既要足够软以感知形变和纹理,又要耐磨、耐压、能回弹不变形。 [事实] 嘉宾称其材料可以做到超过百万次按压不坏,同时捕捉微米级纹理。 [事实] 嘉宾认为掌握芯片和材料,才能在触觉行业建立更持久的壁垒。

[45:54] 成本、量产与数据壁垒

[事实] 主持人提到成本、稳定性和可靠性的“不可能三角”。 [事实] 嘉宾认为降成本要从底层 BOM 成本出发,通过更高研发投入降低单个传感器的实际材料和生产成本。 [事实] 嘉宾用 SpaceX 降低火箭发射成本作类比,认为必须通过底层自研解决成本问题。 [事实] 嘉宾称一目科技把研发投入放在芯片、材料、光学和算法上,希望触觉传感器未来成为每个机器人都会有的大规模产品。 [事实] 嘉宾认为长期壁垒还会建立在模型和数据上,TouchNet 可形成数据飞轮效应。

[48:13] 公司边界与研发投入重点

[事实] 主持人询问一目科技是否会做灵巧手甚至自己的机器人。 [事实] 嘉宾表示这不是当前最关注的方向,公司更关注具身智能中最难的感知、手和大脑问题。 [事实] 嘉宾称一目科技不会直接下场做大脑,而是为大脑提供物理接入层。 [事实] 当被问到如果有 100 亿会投向哪里时,嘉宾回答会投向芯片、材料、算法和数据。 [事实] 嘉宾把一目科技定位为物理接入层的基础设施公司。

[49:11] 未来想象与家用机器人的难度

[事实] 嘉宾表示第一步是让触觉技术真正落地和普及。 [事实] 嘉宾认为具身智能会较快到来,并希望公司能帮助实现通用具身智能体。 [事实] 嘉宾认为这类智能体的价值在于替代重复性劳动,把人从繁琐或危险领域中解放出来。 [事实] 嘉宾认为具身智能体是比家用机器人更大的概念,可能包括家庭、办公室、工厂中的机器人群体。 [事实] 嘉宾承认家用机器人要求比工业机器人更高,因为每个家庭环境不同,泛化能力和安全性挑战更大。

播客点评/总结

这期节目的价值在于把“机器人触觉”从一个容易被忽略的硬件部件,放回到具身智能、数据飞轮和模型泛化的大框架中讨论。嘉宾用视觉缺陷、手部麻醉、工业插拔、医学穿刺等例子,把触觉为什么必要讲得比较具体。

亮点是讨论覆盖了硬件、材料、芯片、仿真、数据集、模型 encoder 和落地场景,而不只是停留在概念层面。尤其是关于真机数据、仿真数据和视频预训练如何配合的部分,能帮助听众理解机器人模型训练为什么不同于纯视觉或语言模型。

[推测] 局限在于节目主要从一目科技及嘉宾视角展开,对其他触觉路线的反方观点、行业成本细节和量产验证数据讨论较少,因此部分判断仍需要结合更多公司和真实部署结果来看。

[推测] 这期适合关注具身智能、机器人创业、工业自动化、传感器硬件和多模态模型的人收听;如果只想了解消费级家用机器人进展,节目中相关内容更多是远景判断而非近期产品讨论。