En @allen_ai, planeamos profundizar en la discrepancia entre entrenamiento e inferencia y aprovechar el trabajo de aprendizaje por refuerzo (RL) con consistencia bit a bit de @vllm_project, @thinkymachines y @sgl_project. Si te interesa, solicita la pasantía (enlace en este hilo) y mencióname.
@allen_ai @vllm_project @thinkymachines @sgl_project Aprendizaje por refuerzblog.vllm.ai/2025/11/10/bit…a bit: https://t.co/V4L3aRjob-boards.greenhouse.io/thealleninstit…cticas: https://t.co/YiWhZtqEG1