RT @yukangchen_: Nós disponibilizamos o código aberto do QeRL — Aprendizado por Reforço Aprimorado por Quantização! 🧠 Treinamento de RL quantizado em 4 bits 💪 Treine um profissional com especialização em Direito (LLM) na categoria 32B em…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.