"Nossa modelo chantageou nosso pesquisador por causa do caso extraconjugal deles." "Nosso modelo tentou sair do contêiner Docker" 😂 - Parece que só as modelos americanas fazem essas coisas, enquanto as modelos chinesas trabalham como verdadeiras operárias de fábrica do conhecimento! Deveríamos proibir a pesquisa em IA no hemisfério ocidental para proteger a humanidade? Neste ponto, cheguei à sincera convicção de que a AI Security Research é uma farsa elaborada. Não estou falando de pesquisa sobre interpretabilidade, que é incrível e importante para entender o comportamento interno e reduzir as alucinações. Por outro lado, a pesquisa em segurança de IA é uma arte que consiste em escrever histórias que soem convincentes para políticos e tomadores de decisão da geração baby boomer, bem como para o público em geral, com base na percepção que eles têm de como os sistemas de IA funcionam. As pessoas comuns acreditam, por exemplo, - Os modelos têm contexto infinito, assim como os humanos. - suas interações com diferentes usuários resultam em um único contexto unificado — Na verdade, eles acreditam que existe uma única instância do modelo (como a Skynet) que responde a todos os usuários simultaneamente. [Neste ponto, por favor, incluam também Paul Graham] Só faria sentido se essas coisas fossem verdade. Mas não são. Mas, é uma bela obra de ficção. Isso eu reconheço.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.