meng shao (@shao__meng): Andrej Karpathy 2025 年 LLM 年终回顾：6 个“范式转变” 1. RLVR：2025 年强化学习从可验证奖励（RL…

Resumen de fin de curso de maestría en Derecho 2025 de Andrej Karpathy: 6 "Cambios de paradigma" 1. RLVR: En 2025, el aprendizaje por refuerzo pasó de la recompensa verificable (RLVR) a la nueva fase estándar de la formación LLM. Al optimizar las recompensas durante un largo período en dominios objetivos como matemáticas/programación, los modelos desarrollan de forma natural estrategias de razonamiento similares a las humanas e impulsan importantes mejoras de capacidad a lo largo del año. 2. Fantasmas vs. Animales / Inteligencia desigual: Para 2025, la industria comenzará a comprender que LLM es un "fantasma invocado" en lugar de un "animal evolucionado". Su inteligencia es extremadamente desigual, y si bien es un genio en campos verificables, es fácil de engañar, lo que lleva a una pérdida total de confianza en los puntos de referencia. 3. Capa de aplicación LLM emergente: Representada por Cursor, una nueva capa de aplicación LLM surgió en 2025. Mediante ingeniería de contexto, orquestación multillamada, interfaces dedicadas y controles deslizantes autónomos, transforma a los "estudiantes universitarios generales" organizados por el modelo básico en "equipos profesionales" en campos verticales específicos. 4. Agentes de IA locales: Claude Code presenta por primera vez una demostración convincente de agentes LLM de ejecución local que pueden integrarse profundamente en el entorno privado y los datos del usuario, transformando la interacción de IA de un sitio web de chat basado en la nube en un "pequeño sprite que reside en la computadora". 5. Vibe Coding: En 2025, surgirá el "vibe coding", que permitirá a las personas generar código simplemente describiendo sus intenciones en lenguaje natural, democratizando la programación, impulsando la productividad profesional y haciendo que el código sea barato y desechable. 6. El prototipo de LLM GUI: Nano Banana anticipó la era de las interfaces gráficas de usuario para LLM, que permitieron a los modelos generar información en un formato visual que los humanos prefieren al integrar profundamente texto, generación de imágenes y conocimiento del mundo.

Hilo de meng shao (@shao__meng)

Información del autor

Contenido del hilo