Gostei também da parte sobre estilo/compatibilidade de raciocínio. Acredito que há muito potencial inexplorado aqui para modelos pequenos, já que a geometria dos caminhos de atenção exige mais do que uma simples destilação.
Link: arxiv.org/pdf/2512.11463
