Estoy de acuerdo en que el aprendizaje continuo es una prioridad, pero la gente solo parece tener preguntas y ninguna respuesta sólida. Otros aspectos destacados de Neurips (ver también mis comentarios sobre el subagente RLaaS a principios de esta semana) - A los investigadores* sorprendentemente no les importa: - OCR de búsqueda profunda - Muón/MuonClip - mechinterp - modelos mundiales - post entrenamiento (!?) - laboratorios chinos - la gente es positiva en - nueva arquitectura: transformadores anidados, modelos híbridos (atención lineal/SSM/escasez mezclados con atención completa) - nano plátano - GPT-OSS - robótica - xAI, Antrópico - Declaración de Ilya > Podcast de Ilya - ¿Se exagera la importancia de RL Envs y AI4Science? / Es difícil separar el progreso real del entusiasmo por la financiación. *fuera de los especialistas obvios en esas áreas particulares. Para ser súper claro, esto NO es que yo diga que están sobrevalorados, es lo que era el sentimiento. Básicamente, soy más positivo que el consenso en la mayoría de estos, empezando a sentir que tengo una visión diferente e informada de los investigadores especializados y eso se siente bien, honestamente.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.