A curvatura dos pontos de treinamento memorizados é muito mais acentuada do que a dos pontos não memorizados, o que significa que ordenar os componentes de peso da maior para a menor curvatura pode revelar uma distinção sem rótulos explícitos. Venho falando de «singularidades pontiagudas» há tempos, elas são tratadas formalmente.
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.

