Me gusta pensar que una de las motivaciones de todos estos artículos es manipular los métodos internos de DS con la suficiente intensidad como para que DeepSeek los abandone. Pero la Ballena se siente muy orgullosa en silencio. Quizás demasiado. Sospecho que prefieren poner patas arriba a GRPO antes que admitir una derrota. Pero todos ganan.
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
