RT @ShengyuanS: Olá Dzmitry, nosso INT4 QAT é somente de peso com quantização falsa: mantemos os pesos BF16 originais na memória durante o processo…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.