RT @abhayesian: 🧵 A principios de este año, Anthropic realizó un juego de auditoría en el que equipos de investigadores investigaron un modelo con un objetivo oculto…
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.