Suave DiLoCo: harxiv.org/pdf/2512.17131(@aaron_defazio et al) Alternativa não distribuída, com menor sobrecarga de memória (apenas um buffer extra) e atualização contínua em vez da atualização externa periódica (e bastante abrupta) do DiLoCo clássico. Estou curioso para ver se será expandido para um sistema distribuído!
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
