La seconde moitié des agents IA : pourquoi « l’ingénierie du contexte » deviendra-t-elle un nouvel avantage technologique ? La présentation éclairante du PDG de Box, @levie, a offert une analyse objective et rigoureuse de l'évolution inévitable des agents d'IA, passant des « capacités du modèle » à « l'architecture du système ». Le changement de paradigme fondamental : des erreurs logiques à l'asymétrie de l'information Levie soutient qu'avec l'amélioration fulgurante des capacités de raisonnement des grands modèles, la cause profonde de l'échec des agents intelligents dans l'exécution de tâches complexes ne sera plus l'incapacité à effectuer une déduction logique, mais plutôt le manque d'informations de base pertinentes. Dans ce contexte, les développeurs passent de « l'amélioration de l'intelligence des modèles » à « la réduction des lacunes en matière d'information ». L'essence de « l'ingénierie du contexte » consiste à utiliser la rétro-ingénierie pour déduire les dimensions et les densités des informations dont un super-expert interdomaines a besoin pour traiter une tâche spécifique. Le paradoxe des agents intelligents : des « génies amnésiques » hautement intelligents Il a proposé une analogie profonde qui révèle les limitations physiques des architectures actuelles d'agents intelligents : • Expertise multidisciplinaire : L'agent intelligent possède une base de connaissances de niveau expert couvrant de multiples domaines tels que le droit, l'ingénierie et le commerce. • Sans état et spatialement limité : malgré sa grande intelligence, il est « sans état » et limité par la fenêtre de contexte, et ne peut traiter qu'une quantité moyenne d'informations à la fois avec précision. Cette caractéristique d'« intelligence supérieure mais de tendance à l'oubli » exige du système une précision de transmission de l'information extrêmement élevée. Un excès d'informations risque de perturber le modèle, tandis qu'un manque d'informations ne permet pas une prise de décision éclairée. Axes prioritaires : Mise en place d’une chaîne d’approvisionnement en information efficace. Afin de pallier les limitations de mémoire des agents intelligents, les investissements technologiques du secteur se concentrent sur les quatre axes suivants, dans le but de construire un système de distribution d’information en boucle fermée : • Récupération et rappel : Construire une architecture de recherche et de récupération à grande échelle et à faible latence pour garantir l'acquisition de données en temps réel. • Tri heuristique : les informations récupérées sont triées par pondération à l’aide d’un algorithme afin de garantir que le contexte le plus critique soit placé en premier en tête du modèle. • Ingénierie des invites système : définir les limites des tâches et la logique d’exécution grâce à des invites système affinées. • Optimisation de l'état et de l'espace : Dans une fenêtre de contexte limitée, des méthodes innovantes de gestion des données maximisent les gains d'espace pour accueillir une logique de raisonnement plus complexe. L'effet de levier de la puissance de calcul : l'avantage asymétrique de l'IA dans le traitement des données Levie a mis en lumière un avantage sous-estimé : la puissance de calcul de l’IA en matière de gestion du contexte surpasse de loin celle des humains. Les humains ont une capacité limitée à traiter de grandes quantités de données hétérogènes en un court laps de temps, tandis que les agents intelligents peuvent exploiter d'importantes ressources de calcul pour analyser, affiner et réorganiser des volumes massifs de données en quelques millisecondes. Cette capacité de « traitement de l'information piloté par la puissance de calcul » constitue le principal obstacle à la création d'agents intelligents performants.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
