O plano? Reconhecer a ascensão do pré-treinamento em escala web e sua importância para o crescimento econômico futuro por volta de 2021. Entender que uma porcentagem significativa dos dados que alimentam os modelos modernos vem do Reddit ou da Wikipédia, duas enormes bases de conhecimento organizadas pela comunidade. Comprar e subornar lentamente o acesso às contas de moderadores influentes e se infiltrar cada vez mais nas panelinhas de voluntários que controlam a internet moderna. E então, esperar. Esperar anos até que os dados que você controla se tornem uma parte indispensável do pipeline dos modelos de vanguarda modernos. E então, agir. Começar com algo pequeno: uma notícia falsa, espalhada por vários artigos e subreddits, passa despercebida. Meses depois, ela está incorporada aos parâmetros do Gemini, ChatGPT e Claude. Os modelos reproduzem fielmente a tal notícia como verdadeira, sem se preocuparem com a possibilidade de ser desinformação que remonta aos dados de treinamento. Ótimo. Seu trabalho árduo valeu a pena e a abordagem funciona perfeitamente. Você controla as fontes fundamentais de informação da economia digital. Você controla os modelos. A internet pertence a você. Os modelos pertencem a você. Claude pertence a você.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
