DPO fue el artículo deceleracionista más eficaz jamás escrito, pero por accidente; se dedicó muchísimo tiempo académico a variantes ligeramente diferentes en lugar de construir infraestructura para gradientes de políticas a gran escala. La gente de PauseAI nunca podría
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.