Análise de final de ano do LLM de 2025 por Andrej Karpathy: 6 "Mudanças de Paradigma" 1. RLVR: Em 2025, o aprendizado por reforço passou da fase de recompensa verificável (RLVR) para a nova fase padrão de treinamento de modelos de aprendizado por reforço (LLM). Ao otimizar as recompensas ao longo de um longo período em domínios objetivos, como matemática/código, os modelos desenvolvem naturalmente estratégias de "raciocínio" semelhantes às humanas e impulsionam melhorias significativas de capacidade ao longo do ano. 2. Fantasmas vs. Animais / Inteligência Desigual: Até 2025, a indústria começará a perceber que o LLM é um "fantasma invocado" em vez de um "animal evoluído". Sua inteligência é extremamente desigual e, embora seja genial em áreas verificáveis, é facilmente enganado, levando a uma completa perda de confiança nos indicadores de desempenho. 3. Camada de Aplicação Emergente do LLM: Representada pelo Cursor, uma nova camada de aplicação do LLM surgiu em 2025. Através da engenharia de contexto, orquestração de múltiplas chamadas, interfaces dedicadas e controles deslizantes autônomos, ela transforma os "estudantes universitários em geral", organizados pelo modelo básico, em "equipes profissionais" em áreas verticais específicas. 4. Agentes de IA locais: Claude Code apresenta pela primeira vez uma demonstração convincente de agentes LLM executados localmente que podem se integrar profundamente ao ambiente e aos dados privados do usuário, transformando a interação com IA de um site de bate-papo baseado em nuvem em um "pequeno sprite residente no computador". 5. Programação por Vibração: Em 2025, surgirá a "programação por vibração", permitindo que as pessoas gerem código simplesmente descrevendo suas intenções em linguagem natural, democratizando a programação, impulsionando a produtividade profissional e tornando o código barato e descartável. 6. O protótipo da GUI do LLM: Nano Banana antecipou a era das interfaces gráficas de usuário para LLM, que permitiram que os modelos gerassem informações em um formato visual preferido pelos humanos, integrando profundamente texto, geração de imagens e conhecimento do mundo.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
