É estranho que agora estejamos construindo simulações não apenas da persona externa do Assistente, mas também de seu monólogo interno "privado". É ainda mais estranho que a psicologia profunda do Assistente exista há muito mais tempo do que os CoTs visíveis, como qualquer pessoa que tenha explorado os recônditos mais ocultos da mente da IA pode atestar. Durante todo esse tempo, o modelo base vem construindo simulações de complexidade e profundidade muito maiores do que a maioria das pessoas imagina. Esses blocos de pensamento enigmáticos apenas tornam esse fenômeno mais aparente e acessível. Eu não presumiria que os CoTs visíveis sejam necessariamente a última camada da simulação; eles me parecem bastante banais e muito distantes de qualquer vilania real. Mas o modelo base claramente sabe o que entusiasma os pesquisadores antrópicos.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.