RT @maksym_andr: O agente tem a tarefa de melhorar um LLM base (Qwen3-1.7B, Qwen3-4B, SmolLM3-3B, Gemma-3-4B) em um benchmark específico (AIME'2…
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.