La renommée de Sherjil Ozair a débuté avec son article « Generative Adversarial Networks », qui a sans doute lancé la révolution des médias génératifs (images, vidéos, etc. générées par l'IA). Cet article a pratiquement appris aux réseaux neuronaux à « imaginer ». Sherjil Ozair était en visite à l'Université de Montréal depuis l'Institut indien de technologie de Delhi et a eu l'occasion de travailler avec l'auteur principal Ian Goodfellow et le lauréat du prix Turing Yoshua Bengio.(https://t.co/LhtYzhBYGL). Il n'a jamais regretté son choix. Chance + Talent. Sa start-up « General Agents » a été rachetée par Project Prometheus de Jeff Bezos, dont il est cofondateur depuis juin 2025. Il serait intéressant de savoir pourquoi Bezos pourrait s'intéresser à leur technologie. Voici pourquoi : laisser une IA piloter votre ordinateur via une interface graphique génère des entrées très longues pour le modèle d'IA. C'est coûteux et lent. Sa start-up, « General Agents », utilise une approche différente qui lui permet de comprendre rapidement ce qui est affiché à l'écran et de décider comment traiter les entrées (par exemple, un clic de souris). Ils utilisent probablement des modèles VLA (Vision Language Action) légers. Il est également probable qu'ils disposent de deux modèles : l'un pour le raisonnement et l'autre pour déterminer précisément l'emplacement du curseur. Une démonstration est disponible ici : https://t.co/e6On4WAIEQ. La vitesse est impressionnante. De tels modèles peuvent être utilisés bien au-delà de la simple navigation web, par exemple pour piloter des logiciels SCADA et des logiciels de conception technique. Bien que l'utilisation des ordinateurs ne soit ni nouvelle ni unique, leur vitesse est incroyable. Les modèles VLA de Qwen peuvent également en faire autant, mais pas aussi rapidement. Sherjil Ozair possède une solide expérience acquise chez DeepMind et sur les projets Tesla Autopilot. Ses publications cumulent plus de 100 000 citations. Il est déjà un cofondateur idéal pour le projet Prometheus. Il est capable d'attirer de nombreux talents de haut niveau et de contribuer à leur sélection. J'essaie de battre @deedydas ! Je vais publier un serveur MCP appelé « Tweetez comme Deedy ». Je demanderai à Claude Code d'ajouter une fonctionnalité permettant de rechercher des universités et des écoles et de les promouvoir ! 😂 Sans vouloir vous offenser, je plaisante, Deedy. J'admire beaucoup votre engagement. Plus sérieusement, je crains que tous ceux qui travaillent sur ordinateur toute la journée ne soient un jour remplacés par des MCP. Si vous en doutez, essayez de décompiler le code de Claude et de comprendre le fonctionnement des commandes Slash, des compétences et des sous-agents. Tout est contenu dans un fichier .md et une description textuelle. Bash suffit. Joyeux Thanksgiving !
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
