A Ai2 acaba de lançar uma série de pequenos modelos ponderados abertos para o olmo3, incluindo Olmo-3-1125-32B (modelo base), Olmo-3-32B-Think, Dolci-Think-SFT-7B, Dolci-Instruct-SFT-7B, Dolci-Think-DPO-7B, Dolci-Instruct-DPO-7B, Dolci-Think-RL-7B e Dolci-Instruct-RL-7B. A pontuação do Olmo-3-32B-Think parece ser a segunda melhor, perdendo apenas para o Qwen3-32B. Ele suporta apenas inglês. A característica mais marcante desta série de modelos é que ela disponibiliza modelos em diversas etapas de treinamento e ajuste fino, facilitando para os usuários a realização do pós-treinamento ou ajuste fino por conta própria. Fiz um teste rápido (Figura 4) e parece estar tudo bem?
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.



