As pessoas subestimam o quão mais difícil seria alinhar agentes que aprendem puramente com a própria experiência aos nossos valores. Por mais que o alinhamento de LLM tenha se tornado uma espécie de indústria caseira, é brincadeira de cx.com/rao2z/status/1…NeurIPS2025
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.