De esquilos a humanos: por que entender o aprendizado animal é fundamental para a IA? Richard Sutton, o pai da aprendizagem por reforço, acredita que: Se pudermos realmente entender como os esquilos aprendem, estaremos a um passo de compreender a inteligência humana. A essência desse ponto de vista é muito simples: os seres humanos são, antes de tudo, animais. Sutton acreditava que a capacidade linguística era meramente "um pequeno enfeite na superfície". Você pode argumentar que os humanos pousaram na Lua e criaram semicondutores; não são essas diferenças fundamentais? Sutton tinha uma perspectiva diferente. Ele se concentrava nos fundamentos da inteligência, nos mecanismos subjacentes compartilhados por humanos e animais. O que faz um esquilo todos os dias? Procure nozes, evite predadores e lembre-se de onde você escondeu a comida. Esses comportamentos aparentemente simples são sustentados por um sistema de aprendizagem complexo: Ele precisa prever onde está a comida, aprender a melhor rota por meio de tentativa e erro e ajustar constantemente sua estratégia com base em recompensas (encontrar nozes) e punições (encontrar perigo). Essa é a essência do aprendizado por reforço. Além disso, o aprendizado supervisionado não existe na natureza. O que é aprendizado supervisionado? Basicamente, o programa te dá um monte de "respostas corretas" e te obriga a segui-las. Mas quando o esquilo está aprendendo, ninguém pega um pequeno quadro-negro e diz: "Este jeito de pular está certo, e aquele jeito de pular está errado." Ela simplesmente continuou tentando e, depois de cair algumas vezes, aos poucos dominou a habilidade de pular entre os galhos. O mesmo vale para os bebês. Se você observar um bebê, perceberá que ele está constantemente experimentando coisas: acenando com os braços, chutando as pernas e colocando objetos na boca. Ninguém lhes demonstra o "procedimento padrão"; eles estão simplesmente explorando o mundo e observando as consequências de suas ações. Sutton acredita que essa abordagem de aprendizagem baseada em objetivos e experiências é a essência da inteligência. Os modelos de linguagem de grande escala atualmente populares são essencialmente produtos de aprendizado supervisionado. Eles aprendem com os caracteres que os humanos já escreveram, em vez de explorar ativamente o mundo como fazem os animais. A imitação não é a base. Eis o ponto de discórdia: os seres humanos não são muito bons em imitação? As crianças não aprendem a falar e adquirem diversas habilidades imitando os adultos? Sutton não nega a existência da imitação, mas acredita que a imitação não é o fundamento, e sim construída sobre um processo mais fundamental de tentativa e erro. Mesmo ao imitar, primeiro é preciso aprender "como imitar". No início, os bebês nem sabem imitar; eles estão apenas experimentando e prevendo quais serão as consequências de suas ações. A capacidade de imitar a si mesmo também se desenvolve por meio desse mecanismo básico de aprendizagem. E quanto à educação escolar? Sutton acreditava que este era um caso excepcional, exclusivo dos seres humanos, e não a norma na natureza. A maioria dos animais nunca se senta em uma sala de aula para ouvir a palestra de um professor durante toda a sua vida, mas ainda assim eles podem aprender habilidades complexas de sobrevivência. A maioria dos mamíferos é capaz de aprendizado contínuo e de ajustar suas estratégias ao se depararem com novos ambientes. No entanto, os sistemas de IA atuais são fixos após o treinamento, o que dificulta a aprendizagem contínua de novas informações. Por outro lado, a IA consegue resolver problemas matemáticos complexos e escrever código, coisas que quase nenhum animal consegue fazer. O que isso significa? Significa que talvez tenhamos nos desviado do caminho. Estamos investindo em IA para fazer aquilo em que os humanos são bons, mas negligenciamos as habilidades básicas que os animais possuem e que a IA não consegue realizar. A visão de Sutton é que, se realmente queremos inteligência geral, devemos primeiro entender como os animais aprendem. Ele também propôs uma perspectiva mais ampla: tanto os humanos quanto os animais são replicadores. O que isso significa? Transmitimos nossos genes de geração em geração através da replicação gênica. Somos muito inteligentes, mas na verdade não entendemos como nossa inteligência funciona. Você pode explicar como o cérebro aprende a andar de bicicleta? O surgimento da IA marca nossa entrada na era do design. Esses agentes são projetados de forma que (teoricamente) saibamos o que cada camada de sua rede neural está fazendo. No futuro, essas IAs serão capazes de projetar novas IAs. Mas Sutton nos lembra que, antes de projetarmos, devemos primeiro entender a inteligência que a natureza já "projetou" — ou seja, os mecanismos de aprendizagem dos animais. Talvez o verdadeiro avanço não esteja em permitir que a IA escreva poesias melhores. A ideia é torná-lo semelhante a um esquilo, capaz de explorar ativamente ambientes desconhecidos, aprender continuamente e responder com flexibilidade às mudanças. Afinal, os animais vêm desenvolvendo inteligência há centenas de milhões de anos. Nós estamos apenas começando. --- Resumo gerado por IA, formatado manualmente.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.