Nous avons récemment publié un chapitre de plus de 3 000 mots, écrit par @KeremTurgutlu, inspiré de la superbe vidéo de @karpathy intitulée « Construisons le tokenizer GPT ». Il contient des images, des liens, du code, des schémas… Kerem a maintenaanswer.ai/posts/2025-10-…illé expliquant comment il l'a réalisé : https://t.co/EIiejHe8hS
Et si vous ne l'avez pas encore lu, lisez absolument ce chapitre ! Grâce aux sources d'Andrej, il offre une explication vraiment excellente du fonctionnement des tokeniseurs, et toute personne intéressée par les LLM se doit de cofast.ai/posts/2025-10-…ttps://t.co/aSgsZz1tnm