π_RL Ajuste fino en línea del aprendizaje por refuerzo para modelos de visión-lenguaje-acción basados en flujo
Discute con el autor:huggingface.co/papers/2510.25…g
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
2 tweets · 3 nov 2025, 15:40
π_RL Ajuste fino en línea del aprendizaje por refuerzo para modelos de visión-lenguaje-acción basados en flujo
Discute con el autor:huggingface.co/papers/2510.25…g