Il s'agit d'une architecture hybride MLA-GDN (à la sauce Kimi). Kimi Moonshot s'est longtemps concentré sur les contextes longs. On constate enfin qu'ils ont ouvert le code source de ce travail, c'est super.
Décision très confiante
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
2 tweets · 30 oct. 2025, 13:54
Il s'agit d'une architecture hybride MLA-GDN (à la sauce Kimi). Kimi Moonshot s'est longtemps concentré sur les contextes longs. On constate enfin qu'ils ont ouvert le code source de ce travail, c'est super.
Décision très confiante