As pessoas me dizem que, a menos que você possua GPUs e escreva kernels, o Tinker torna o pós-treinamento muito mais barato. É também uma API deliciosamente abstrata. pytorch: • y = model.forward(x) • L = função_de_perda(y) • L.backward() Tinker/Torchtitan: • perda = model.forward_backward(x)
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.