Se o dedo de uma pessoa for anestesiado localmente, ela perderá a precisão até mesmo na ação mais básica de riscar um fósforo. Superficialmente, pensamos que pegar e riscar um fósforo requer apenas "habilidade manual", mas, na realidade, depende da complexa sensação tátil nas pontas dos dedos. Sem feedback tátil, a mão humana é apenas uma pinça desajeitada. Os corpos de Meissner localizam-se na junção entre a epiderme e a derme, sendo particularmente densos nas pontas dos dedos, lábios e palmas das mãos. São estruturas ovais compostas por camadas de células achatadas que circundam terminações nervosas. São especificamente projetados para detectar toques leves e vibrações de baixa frequência (10-50 Hz). As células de Merkel estão localizadas mais próximas da superfície da pele e formam complexos com as terminações nervosas. Elas têm uma capacidade de adaptação lenta — continuam enviando sinais enquanto o estresse persistir. O maior receptor tátil do corpúsculo de Pacini é visível a olho nu, assemelhando-se a uma cebola em miniatura — uma fibra nervosa envolta em dezenas de camadas concêntricas de tecido conjuntivo. Os corpúsculos de Ruffini são estruturas fusiformes localizadas profundamente na derme. Adaptam-se lentamente e são sensíveis à pressão contínua e ao estiramento da pele. Quando você segura um objeto ou sente a posição e o ângulo das articulações dos dedos, os corpúsculos de Ruffini fornecem informações contínuas sobre o estado da pele. É por isso que sou pessimista em relação aos métodos atuais de treinamento para robôs humanoides. Porque por trás de cada movimento humano "macro" existe uma densa rede de sensores "micro" — a pele. O Optimus Prime de Musk: treinamento visual completo. Câmeras coletam informações, redes neurais geram ações. Parece incrível: IA vê, IA aprende, IA age. Tudo é gerenciado por poder computacional; acreditamos que a força bruta pode criar milagres. Mas isso é substituir "pele" por "olhos". Uma pessoa ainda consegue tirar uma chave do bolso de olhos fechados. Isso acontece porque as pontas dos dedos conseguem sentir forma, peso, temperatura e textura. A densidade dessas informações é algo que a visão jamais conseguirá captar. Você pode ver uma chave com uma câmera, mas não consegue perceber o "ajuste de 0,1 milímetro entre o polegar e o indicador ao segurar a chave". A essência do treinamento de ponta a ponta é usar uma fonte de sinal de baixa largura de banda (visão) para simular um sistema de controle de alta largura de banda (tátil e proprioceptivo). Trata-se de uma abordagem de redução de dimensionalidade — o inverso. Nos vídeos de demonstração que você vê, os movimentos do robô são tão lentos quanto o Tai Chi. Não é porque os motores não sejam rápidos o suficiente, mas sim porque não há feedback tátil em tempo real; ele precisa trocar "lentidão" por "estabilidade". Cada contato é uma aposta, cada aplicação de força é um golpe às cegas. Os bebês humanos aprendem a agarrar em seis meses usando o quê? Milhões de toques, apertos, solturas e mais toques. A cada vez, as pontas dos dedos dizem ao cérebro: "Esta pressão, este ângulo, este resultado". É um ciclo fechado. Treinamento de ponta a ponta? Não há um ciclo fechado. Ou melhor, há um ciclo fechado incompleto — nenhuma dor sentida pela pele devido a erros operacionais, nenhuma frustração sentida devido à dor. Apenas intervenção humana, certa ou errada. Como um mecanismo de recompensa rudimentar e superficial pode cultivar mãos verdadeiramente "hábeis"?
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.