X (Twitter)

Ai2 acaba de lanzar una serie de modelos pequeños ponderados abiertos para olmo3, incluyendo Olmo-3-1125-32B (modelo base), Olmo-3-32B-Think, Dolci-Think-SFT-7B, Dolci-Instruct-SFT-7B, Dolci-Think-DPO-7B, Dolci-Instruct-DPO-7B, Dolci-Think-RL-7B y Dolci-Instruct-RL-7B. La puntuación del Olmo-3-32B-Think parece ser la segunda más alta después de la del Qwen3-32B. Solo admite inglés. La característica más distintiva de esta serie de modelos es que publica modelos en varias etapas de entrenamiento y ajuste fino, lo que facilita a los usuarios realizar ellos mismos el post-entrenamiento o el ajuste fino. Realicé una prueba rápida (Figura 4) y parece estar bien, ¿no?

Hilo de karminski-牙医 (@karminski3)

Información del autor

Contenido del hilo