D'après une fuite du compte X TestingCatalog : Google a ajouté un mode de « recherche automatique » multi-agents à Gemini Enterprise. (https://t.co/aBhEeNzIge) Google développe Gemini for Enterprise, un système multi-agents. On lui fournit un sujet et des critères d'évaluation, et il génère automatiquement une multitude d'idées. Il peut ensuite réunir une équipe d'agents et examiner ces idées tour à tour, comme lors d'un tournoi. Ce système peut fonctionner en continu pendant environ 40 minutes. Pour un produit destiné aux utilisateurs professionnels, il s'agit d'un processus d'inférence continu très long. Au terme de ces 40 minutes, vous recevrez une longue liste d'idées, classées de la meilleure à la moins bonne selon les critères que vous avez définis au préalable. Le système peut générer environ 100 idées simultanément. Pour chaque idée, vous recevrez : - Un aperçu - Une explication plus détaillée - Un résumé de l'avis - Un compte rendu complet et détaillé - Et un « rapport de performance en tournoi » dédié. Ce « Rapport de performance » est un document distinct que vous pouvez ouvrir et consulter à votre convenance. Toutes les idées générées sont sélectionnables ; vous pouvez cliquer sur n’importe laquelle pour l’explorer plus en détail. Dans la version bêta actuelle, Google semble avoir conçu trois agents, dont deux sont basés sur ce système de « tournoi » multi-agents. La première s'appelle « Génération d'idées ». Dans ce mode, il vous suffit de fournir un sujet ; l’agent lancera alors un flux de travail multi-agents complet, utilisant une « évaluation de type tournoi » pour générer et classer diverses idées pertinentes. (Cette évaluation de type tournoi signifie que les solutions sont constamment en compétition les unes contre les autres, les meilleures étant conservées et les moins performantes éliminées.) Le second est appelé « co-scientifique ». Celui-ci est davantage axé sur les scénarios de recherche et développement scientifiques. Vous pouvez spécifier un sujet de recherche, fournir des données supplémentaires, et une équipe complète d'agents intelligents générera d'abord des pistes et des plans de recherche, puis utilisera le même mécanisme de compétition pour évaluer ces idées, mais cette fois-ci en mettant l'accent sur les besoins de la recherche et de l'exploration scientifiques. Le point le plus intéressant ici est la puissance de calcul incroyablement élevée qui y est investie. Permettre à un agent de travailler en continu sur une tâche pendant environ 40 minutes est considéré comme une « configuration de luxe » dans la plupart des outils d'agents actuels. Pendant 40 minutes, le système traite le problème en continu, le générant, le filtrant, le notant et le réorganisant constamment. Actuellement, ces fonctionnalités sont exclusives à Gemini for Enterprise, sont en développement interne, invisibles pour les utilisateurs finaux et ne sont pas encore disponibles au public. Comparée aux implémentations d'agents existantes, cette solution représente un progrès considérable. Même les agents avancés dotés de fonctionnalités similaires à celles d'un navigateur sont généralement limités par le nombre de fenêtres contextuelles et le temps d'exécution. Cette fois-ci, Google mise directement sur une importante puissance de calcul à destination des entreprises, en créant une interface utilisateur performante. Cette approche correspond parfaitement au concept d'« IA de niveau 3 » : un agent d'IA de ce niveau est capable de travailler en continu sur le même problème pendant une période prolongée. (Le terme « niveau 3 » n'est pas une norme unifiée, mais plutôt une terminologie courante dans le secteur pour désigner les agents capables de travailler en continu pendant de longues périodes.) Dans cette optique, un agent exécutant une tâche unique pendant 40 minutes constitue un exemple très typique, voire novateur. En pratique, ce système fournit un ensemble d'idées pertinentes et affinées. Mais il ne s'agit pas d'une simple collection de suggestions aléatoires ; c'est un ensemble structuré de pistes de recherche : compte tenu de vos données et du contexte de votre problématique, ces pistes peuvent mener à des découvertes d'une grande valeur. Par conséquent, le développement par Google de cette fonctionnalité extrêmement puissante, spécifiquement destinée aux organisations, aux entreprises et aux équipes de recherche, est en soi très intéressant. Lorsque cette fonctionnalité sera enfin disponible pour le grand public, elle pourrait constituer une avancée majeure, notamment si ces agents sont finalement basés sur Gemini 3 Pro. Actuellement, Gemini 3 Pro n'est pas encore disponible dans Gemini Enterprise ; on ignore donc quel modèle est utilisé par ces agents expérimentaux. Il reste encore beaucoup à tester et à vérifier. Lorsque vous soumettez une requête au système, celui-ci vous fournit d'abord un résumé des objectifs : les dimensions à évaluer et les pistes de recherche et de sélection des idées. Ce n'est qu'après votre confirmation que le système lancera la tâche principale. Cela revient à définir avec vous la manière précise dont je compte appréhender votre problème avant de mobiliser une importante puissance de calcul. En plus du flux de travail multi-agents pour les tournois, Gemini Enterprise propose un autre agent appelé « Discutez avec vos documents », doté de sa propre interface utilisateur. Cet agent permet aux utilisateurs de télécharger des fichiers PDF jusqu'à 30 Mo et d'engager ensuite des conversations dédiées avec ces documents. Cette fonctionnalité fait également partie de Gemini Enterprise, mais elle n'est pas encore disponible pour le grand public ni en production. Son principe repose sur l'analyse et l'intégration de fichiers PDF jusqu'à 30 Mo dans le contexte du modèle, permettant ainsi aux utilisateurs d'extraire des informations plus pertinentes des documents existants sans avoir à se contenter de feuilleter manuellement les documents. De nombreuses autres fonctionnalités sont en cours de développement pour Gemini Enterprise, mais ces deux lignes sont vraiment les plus remarquables : 1. Flux de travail de type tournoi multi-agents 2. Agents intelligents spécialisés orientés documents L'architecture multi-agents basée sur les tournois semble particulièrement novatrice : aucun autre fournisseur de services LLM (Large Language Model) ne propose d'équivalent à ce niveau. Les tournois multi-agents restent très rares dans les outils destinés aux utilisateurs finaux. Grok Heavy pourrait servir de point de comparaison, mais son approche diffère probablement de celle de Google. Une fois ces agents pleinement opérationnels, il serait extrêmement précieux de disposer d'un système d'évaluation formel et de tests de référence. Même d'après la description actuelle, l'agent Co-scientifique suffit déjà à susciter l'enthousiasme de nombreuses grandes organisations et équipes de recherche, notamment celles qui explorent de nouvelles pistes scientifiques. Quant à la date de lancement officiel de ces agents intelligents, ou à leur éventuelle mise à disposition aux utilisateurs non professionnels, tout cela reste inconnu pour le moment. source:
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.