Um especialista já testou isso. Anteriormente, eu planejava verificar isso analisando estatisticamente a distribuição de palavras de baixa frequência nos tokenizadores de vários modelos open-weight, combinados com o método dual de contagem de tokens do blogueiro. Parece que já se chegou a uma conclusão.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.