Estamos lançando o Bloom, uma ferramenta de código aberto para gerar avaliações de desalinhamento comportamental para modelos de IA de ponta. O Bloom permite que os pesquisadores especifiquem um comportamento e, em seguida, quantifiquem sua frequência eanthropic.com/research/bloomgerados automaticamente. Saiba mais: https://t.co/TwKstpLSy3
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.