局部麻醉一个人的手指,他将连最基本的划火柴的动作都会丧失准确率。表面上我们以为抓起火柴,划火柴,只需要"指头的能力",实际上,它依赖于最底层的指尖上的复杂触觉。
没有触觉反馈,人类的手就是一个笨拙的夹子。
Meissner小体(梅斯纳小体)位于表皮和真皮交界处,特别密集于指尖、嘴唇、手掌。椭圆形结构,由层叠的扁平细胞包裹神经末梢。专门感知轻触和低频振动(10-50Hz)。
Merkel细胞最靠近皮肤表层,与神经末梢形成复合体。慢速适应型——只要压力持续存在,就会持续发送信号。
Pacinian小体(帕西尼小体)最大的触觉感受器,肉眼可见,像个微型洋葱——由几十层同心圆状的结缔组织包裹一根神经纤维。
Ruffini小体梭形结构,位于真皮深层。慢速适应型,对持续的压力和皮肤拉伸敏感。当你握紧一个物体,或者感受到手指关节的位置和角度,Ruffini小体在提供持续的状态报告。
这就是为什么我对现在人形机器人的训练方法很悲观。因为人类每一个“宏观”动作的底层,都铺满了密密麻麻的“微观”传感器——皮肤。
马斯克的擎天柱,端到端的视觉训练。摄像头采集信息,神经网络输出动作。听起来很美:AI看,AI学,AI做。一切都交给算力,相信大力出奇迹。
但这是在用"眼睛"替代"皮肤"。
一个人闭着眼睛,依然能从口袋里掏出钥匙。因为指尖能感知形状、重量、温度、纹理。这些信息的密度,是视觉永远无法企及的。你可以用摄像头看到钥匙,但你看不到"抓握钥匙时,拇指和食指之间那0.1毫米的微调"。
端到端训练的本质,是在用一个低带宽的信号源(视觉),去模拟一个高带宽的控制系统(触觉+本体感觉)。这是降维打击——反向的。
所以你看到的演示视频里,机器人的动作都慢得像太极。不是因为电机不够快,是因为没有实时的触觉反馈,它必须用"慢"来换取"稳"。每一次接触都是一次赌博,每一次力的施加都是一次盲打。
人类婴儿用六个月学会抓握,用的是什么?是百万次的触摸、挤压、松开、再触摸。每一次,指尖都在告诉大脑:"这个力度,这个角度,这个结果。"这是一个闭环。
端到端训练呢?没有闭环。或者说,有一个残缺的闭环——没有皮肤因操作失误感受到的疼痛,没有心里因疼痛而产生的懊恼。只有人为的,对,或者错。粗略、浅薄的奖赏机制,如何打造真正的“灵巧手”?
独立开发:口袋粉丝App、胃之书App,陌生人闹钟App 💿 出版小说集:《坏一坏》、《人生灿灿》 ✒️ 目前在做:https://t.co/XZdd83lfuN