Os modelos de linguagem atuais têm dificuldades para raciocinar em linguagem cifrada, como apontado por Jeff Guo. Treinar ou induzir os LLMs (Learning Learning Machines - Máquinas de Raciocínio Lógico) a obscurecer seu raciocx.com/Jeff_Guo_/stat… cifras simples, reduz significativamente seu desempenho de raciocínio.
Para mais informações sobre as pesquisas de alinhamento da Anthropic, consulalignment.anthropic.coma do Alinhamento: https://t.co/0UHuZdvWd9