Basicamente, esta é uma lista de laboratórios sem o Mandato, seguidores rápidos. > O RLVR dá uma vantagem a pequenos modelos de código aberto. Sempre resumos do alfa do ano anterior. GRM não citado. O Math-V2 não parece "muito inovador". Acho que, em retrospectiva, será tão importante quanto o Math-V1.
O GRM foi um grande acontecimento. Poucos prestaram atenção, embora estivesse próximo da onda de entusiasmo pós-R1 do DeepSeek. O Math-V2 e o V3.2 usam suas ideias. Isso será reconhecido aos poucos. As inovações demoram muito para se difundir.


