Un modèle de langage à 1 quadrillion de paramètres n'est pas totalement exclu (mis à part la question de savoir où trouver toutes ces données). Bien qu'il vous faudrait probablement 25 % de GPU supplémentaires pour le contexte et le cache KV 100 000 H100 pourraient probablement y arriver.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
