Ilya esclareceu e complementou o conteúdo de sua entrevista no Twitter: Há um ponto que não deixei claro na entrevista, então vou adicioná-lo aqui: Continuar a escalar da forma atual — aumentando o poder computacional, os dados e os ambientes de treinamento — certamente levará a melhorias adicionais. Não haverá estagnação; pelo contrário, a tecnologia continuará a melhorar. No entanto, algo importante sempre falta. Isto serve para corrigir um possível mal-entendido. Na entrevista, ele falou muito sobre "voltar à era da pesquisa" e que "os métodos atuais vão atingir um limite", o que poderia facilmente levar as pessoas a pensar que ele estava pessimista em relação à lei de escalabilidade e que continuar a investir em poder computacional, dados e treinamento de aprendizado por reforço se tornaria ineficaz. Ele disse que não era isso que queria dizer; o caminho atual continuará a trazer melhorias e não estagnará. O modelo continuará a se fortalecer, o padrão de referência continuará a subir, o produto continuará a evoluir e a empresa continuará a gerar lucro. Observe o "mas" no final. Há coisas que você simplesmente não consegue obter, não importa o quanto tente dimensioná-las. É como treinar para uma corrida de velocidade. Continue treinando e seu tempo vai melhorar, de 12 segundos para 11,5 segundos, depois para 11 segundos, ou até mesmo 10,9 segundos. Isso sim é progresso de verdade. Mas se seu objetivo é aprender a voar, então não importa o quão rápido você corra, não fará diferença; isso exige uma habilidade completamente diferente. O que está faltando? Com base no conteúdo da entrevista, essa "deficiência significativa" provavelmente se refere a: 1. A verdadeira capacidade de generalização não se resume a ser capaz de executar muitas tarefas após treinamento com grandes quantidades de dados, mas sim a ser capaz de aprender rapidamente coisas novas a partir de experiências limitadas e garantir que o que foi aprendido permaneça estável e confiável em novos cenários. 2. Alunos altamente eficientes conseguem aprender a dirigir em 10 horas e a programar seus equipamentos em poucos meses, antes mesmo de poderem trabalhar. Esse nível de eficiência não pode ser alcançado por meio de treinamento prévio com grandes quantidades de dados. A analogia dos "dois alunos" na entrevista é muito reveladora. O aluno que pratica por 10.000 horas pode, de fato, continuar a melhorar seus resultados em competições, passando dos 10% melhores para o 1% melhor e, finalmente, para o título de campeão — isso sim é progresso real. Mas ele jamais se tornará o aluno que demonstra "aptidão" após apenas 100 horas de prática.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.