X (Twitter)

📢 Les étudiants de Yochan présentent aujourd'hui quatre articles à l'atelier #NeurIPS2025 Lsites.google.com/view/law-20250D ; https://t.co/xL5ZH7oYDh) : sur la sémantique (ou son absence) des jetons intermédiaires, sur la question de savoir si le DeepSeek R1 RL est « RL seulement de nom » et sur une position s'opposant à l'anthropomorphisation des jetons intermédiaires. 👉Au-delà de la sémantique : l’efficacité déraisonnable des jetons intermédiaires dénués de raison 👉Apprentissage par renforcement : un concept superflu ? Analyse des hypothèses structurelles de l’apprentissage par renforcement après l’entraînement pour les modèles de langage. 👉Les traces de raisonnement interprétables cognitivement améliorent-elles les performances LLM ? 👉Arrêtez d'anthropomorphiser les Toakens intermédiaires en tant que traces de raisonnement/pensée !

📢 Les étudiants de Yochan présentent aujourd'hui quatre articles à l'atelier #NeurIPS2025 LAW 2025 (Salle de bal 20D ;

(Le reste)

Fil de Subbarao Kambhampati (కంభంపాటి సుబ్బారావు) (@rao2z)

Informations sur l'auteur

Contenu du fil