É possível observar uma filosofia muito coerente na fase V3.2, tanto na arquitetura quanto nos métodos, se você analisar com atenção. Não se trata de um "V3 +", mas sim de uma mudança equivalente a uma ou duas gerações, que dispensa uma nova rodada de pré-treinamento. Se a V4 for treinada apenas com uma grande quantidade de dados sintéticos da era V3.2, ela será extremamente poderosa.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.

