Nous publions aujourd'hui deux de nos conférences les plus techniques : @nserrino sur la génération de code du noyau et @jacob_d_kahn sur les modèles du monde du code de Meta. La plupart des gens n'écriront jamais de noyaux à la main, mais mon argument principal est simple : comme le souligne @realDanFu, la puissance de calcul est actuellement largement sous-utilisée. Si vous parvenez à écrire un noyau 40 % plus rapide*, il ne s'agit pas seulement d'une inférence plus rapide, mais cela peut** représenter l'équivalent de l'achat de milliards de dollars de GPU. *Évidemment, ce n'est pas du e2e **Si vous arrivez à éviter de tricher ! Comme le montre Natalie
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.


