Dernière vidéo d'interview d'Ilya, version bilingue intégrale (chinois et anglais). Ilya : L'ère de la mise à l'échelle est terminée, prochaine étape : comment faire en sorte que les modèles apprennent comme les humains Il s'agit de la première présentation systématique par Ilya de ses réflexions approfondies sur le développement actuel de l'IA, l'intelligence future, l'alignement en matière de sécurité et l'évolution de la société humaine depuis son départ d'OpenAI pour fonder SSI. Le thème principal de toute la conversation tournait autour de trois points : Pourquoi les scores actuels aux tests d'IA sont-ils élevés, alors que leurs performances dans le monde réel sont loin d'être idéales ? Comment la « fonction de généralisation et de valeur » de l'intelligence humaine peut-elle inspirer les futures méthodes de formation de l'IA ? Quel type de « superintelligence sûre » SSI souhaite-t-elle construire ? 1. Le problème fondamental de l'état actuel de l'IA : elle peut obtenir des scores élevés, mais elle ne peut pas effectuer de travail pratique. Les modèles actuels (tels que la série GPT) sont exceptionnellement performants sur les tâches de test (évaluations), mais leur impact économique réel est limité. Le modèle peut rencontrer une « erreur cyclique » dans les tâches complexes : corriger un bug ne fait qu'en introduire un autre. Ilya souligne que cela s'explique par le fait que nous nous concentrons trop sur la «récompense des humains» pendant la phase d'apprentissage par renforcement, négligeant ainsi la capacité de généralisation dans le monde réel. 2. Pré-entraînement vs. apprentissage par renforcement : où se trouve la véritable intelligence ? Pré-entraînement : en utilisant « toutes les données » sans sélection humaine, le modèle apprend une projection générale du monde humain. Apprentissage par renforcement (RL) : nécessite un environnement conçu manuellement, et l'objectif est souvent de « faire en sorte que le modèle paraisse meilleur lors des évaluations ». Ilya soutient que cela donne au modèle l'apparence d'un « étudiant qui ne sait que passer des examens », dépourvu de véritable perspicacité et de capacité de transférabilité. 3. La clé de l'intelligence humaine : la fonction de valeur et les émotions Lya a avancé que la raison pour laquelle les humains peuvent apprendre et généraliser dans un monde complexe est que nous possédons un « système de valeurs intrinsèque ». Ce système est émotionnel : Bonheur → Commentaires positifs ; Anxiété → Vous rappeler les risques potentiels ; Honte → Adapter ses stratégies sociales ; La curiosité → Inspire l'exploration. En apprentissage par renforcement, cela s'apparente à une fonction de valeur implicite. Cela permet aux gens de savoir à l'avance que « la direction est mauvaise », plutôt que d'attendre un signal de sanction. Par conséquent, il croit : « La véritable intelligence ne se limite pas à la capacité de prédire, mais englobe un système de valeurs constamment mis à jour. » Si les futures IA peuvent apprendre à « évaluer elles-mêmes si la tâche est dans la bonne direction », elles posséderont une « capacité d'apprentissage axée sur le sens » comme les humains. 4. « L’ère de la mise à l’échelle est terminée, et l’ère de la recherche est arrivée. » Ilya a vivement critiqué l'état actuel de l'industrie de l'IA. Il a affirmé que la dernière décennie de progrès en IA pouvait être divisée en deux périodes : 2012-2020 : L'ère de la recherche → L'innovation provient d'architectures révolutionnaires (AlexNet, Transformer). 2020-2025 : L'ère de la mise à l'échelle → Tous les efforts sont concentrés sur « l'accumulation de données, de puissance de calcul et de paramètres de modèle ». Il estime que cette tendance a atteint son apogée : « La mise à l'échelle a étouffé l'innovation. » Actuellement : la puissance de calcul reste élevée, mais les avantages d'une accumulation supplémentaire de ressources diminuent. La prochaine avancée majeure devra se recentrer sur la question de savoir comment faire en sorte que le modèle apprenne comme un humain, plutôt que de nécessiter une puissance de calcul accrue. Autrement dit, l'accent est passé de l'expansion quantitative à l'innovation structurelle. La clé de la compétitivité future ne résidera pas dans la puissance de calcul, mais plutôt dans la capacité à proposer de nouveaux principes d'apprentissage. 5. Feuille de route pour les dix prochaines années Prédiction d'Ilya : Dans les 5 à 20 prochaines années, l'IA apprendra à apprendre de manière similaire à l'humain ; Ça peut: Explorez activement le monde ; Comprendre les lois de la physique et de la société ; Réflexion sur soi ; Il permet également un raisonnement intermodal (intégration multisensorielle). Une fois ce système arrivé à maturité, il entraînera : Explosion de la productivité économique ; Les modèles d'enseignement et de recherche ont été complètement remaniés ; La relation entre les humains et les machines est entrée dans l'ère de la « co-intelligence ». Ilya a toutefois souligné que de tels systèmes devraient être déployés progressivement et de manière transparente afin de permettre au public et au gouvernement de comprendre leurs capacités et leurs risques. Il a souligné que SSI procédera de manière progressive, sécurisée et transparente : les capacités, les risques et les stratégies de contrôle à chaque étape feront l'objet d'un examen externe. (Cette traduction étant générée par une IA, des erreurs mineures peuvent subsister. Veuillez en tenir compte.)
Transcxiaohu.ai/c/ai/ilya-scal…ps://t.youtu.be/aR20FWCCjAsriginale : https://t.co/cd3sNhZ9Jz