Nous lançons Bloom, un outil open source permettant de générer des évaluations de désalignement comportemental pour les modèles d'IA de pointe. Bloom permet aux chercheurs de spécifier un comportement, puis de quantifier sa fréquence et sa gravité dans anthropic.com/research/bloomutomatiquement. Pour en savoir plus : https://t.co/TwKstpLSy3
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.