RT @ShikaiQiu: Combinando µP com decaimento de peso independente da largura (1/largura), descobrimos que tanto o Muon quanto o Shampoo alcançam economias computacionais consistentes de 1,4x e 1,3x…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.