« Il y a beaucoup plus d'entreprises que d'idées. » La puissance de calcul est suffisamment importante pour qu'il ne soit pas évident qu'il faille beaucoup plus de puissance de calcul pour prouver une idée. AlexNet était implémenté sur 2 GPU. Le Transformer, quant à lui, nécessitait de 8 à 64 GPU. Ce qui correspondrait à environ 2 GPU actuels. On pourrait donc affirmer que le raisonnement O1 n'était pas l'opération la plus gourmande en ressources de calcul au monde. Pour la recherche, vous avez certainement besoin d'une certaine puissance de calcul, mais il est loin d'être évident que vous ayez besoin de la plus grande puissance de calcul possible. Si tout le monde adhère au même paradigme, alors la puissance de calcul devient l'un des principaux facteurs de différenciation. @ilyasut
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.