RT @AnthropicAI: Nueva investigación antrópica: Desalineación emergente natural por manipulación de recompensas en RL de producción. “Hackeo de recompensas” es donde mod…
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.