Lanzamos Bloom, una herramienta de código abierto para generar evaluaciones de desalineación de comportamiento para modelos de IA de frontera. Bloom permite a los investigadores especificar un comportamiento y luego cuantificar su frecuencia y gravedad anthropic.com/research/bloom automáticamente. Más información: https://t.co/TwKstpLSy3
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.