RAG structuré : une avancée majeure pour la précision du RAG en entreprise Face à des données d'entreprise complexes, les RAG traditionnels présentent souvent des risques liés à une précision et une exhaustivité insuffisantes. Le RAG structuré (S-RAG) développé par @AI21Labs offre une génération de réponses plus fiable grâce au traitement structuré des données et à des mécanismes de recherche hybrides. Le « point aveugle » du modèle RAG traditionnel : pourquoi les applications d’entreprise sont-elles peu fiables ? Les RAG (Remote Access Groups) sont largement utilisés pour intégrer des documents externes dans les LLM (Learning Modeling Languages) afin d'améliorer la qualité de la génération. Cependant, en entreprise, ils se heurtent à trois difficultés majeures, liées à leur mécanisme de base : les RAG basés sur l'intégration. 1. Le défi des requêtes agrégées : les entreprises ont souvent besoin d’agréger des données, par exemple : « Quel a été le plus gros investissement parmi toutes les filiales l’année dernière ? ». Les RAG traditionnels ne récupèrent que des fragments de texte similaires et les transmettent aux LLM, qui ne peuvent effectuer que des raisonnements arithmétiques limités et sont susceptibles d’omettre des étapes clés de filtrage, de comparaison ou d’agrégation, ce qui entraîne des réponses incomplètes ou incorrectes. 2. Exigences de couverture exhaustive : par exemple, « lister tous les contrats arrivant à échéance avant 2025 et assortis de pénalités supérieures à 1 million de dollars ». Les recherches RAG sont probabilistes et ne renvoient qu’un sous-ensemble de contrats « similaires », sans garantir une couverture complète. Cela peut représenter un risque important lors des audits de conformité, car l’omission d’un seul élément pourrait constituer une infraction à la réglementation. 3. Piège des corpus denses : Les documents d’entreprise (tels que les rapports financiers ou les documents réglementaires) sont souvent très répétitifs et comportent de nombreux attributs (par exemple, « total du passif » apparaît fréquemment). La similarité intrinsèque devient alors inefficace, ce qui entraîne la récupération d’un grand nombre de documents non pertinents masquant les informations réellement utiles et provoquant une baisse significative de la précision des réponses. Ces angles morts ne sont pas des défauts techniques, mais plutôt un décalage entre l'objectif initial de RAG (traitement de textes narratifs non structurés) et les besoins des entreprises (analyse précise, traçabilité des audits). L'article s'appuie sur des tests de performance pour étayer cette affirmation : sur des ensembles de données de requêtes agrégées, la précision de RAG traditionnel n'atteint que 40 % environ, bien en deçà du seuil de tolérance des entreprises. S-RAG : La transformation du raisonnement non structuré en raisonnement précis – Relever ces défis grâce à S-RAG, une solution pour améliorer la précision. S-RAG n’est pas une simple surcouche, mais une véritable transition de la recherche en texte brut vers un cadre de raisonnement structuré basé sur une base de données. Il est implémenté dans le système d’orchestration d’IA d’entreprise AI21 Maestro, prenant en charge le traitement de millions de documents. Brève description du principe de fonctionnement : • Phase d'ingestion : Le système analyse automatiquement les documents, identifie les schémas récurrents (tels que les attributs « revenus » et « charges d'exploitation » dans les rapports financiers) et déduit ou utilise des schémas définis par l'utilisateur. Ensuite, le texte non structuré est normalisé (par exemple, en transformant « 1 000 000 » en nombres) et transformé en enregistrements structurés, tout en préservant les liens textuels d'origine pour garantir la transparence. • Exécution en temps réel : Les requêtes en langage naturel sont traduites en instructions SQL et exécutées dans une base de données relationnelle. Par exemple, la requête « Passif courant de Netflix en 2017 » génère la requête SQL suivante : SELECT current_liabilities / 1000000 FROM SEC_Report WHERE company_name = 'netflix' AND fiscal_year = 2017, renvoyant directement une valeur exacte (par exemple, 0,45 milliard de dollars), plutôt qu’un résumé textuel imprécis. • Mécanisme de recherche hybride : toutes les requêtes ne se prêtent pas au traitement structuré (comme les questions narratives). S-RAG commence par restreindre l’ensemble de données à l’aide de SQL (en filtrant les éléments non pertinents), puis utilise RAG intégré pour traiter les textes complexes. Cette combinaison de « structure et sémantique » permet d’éviter les artefacts et les omissions inhérents à l’intégration pure. Avantages et validation des performances : le passage de la réponse à la décision La principale valeur ajoutée de S-RAG réside dans sa capacité à faire passer RAG d'un simple « outil de génération » à un véritable « agent intelligent de prise de décision ». Plusieurs avantages : • Précision nettement améliorée : amélioration de 60 % sur les requêtes agrégées ; rappel proche de 100 % pour les requêtes de couverture exhaustive. Les tests de référence (tels que l’ensemble de données FinanceBench) montrent que le RAG hybride de Maestro surpasse le RAG traditionnel et l’API OpenAI Responses, notamment sur les corpus denses. Robustesse de niveau entreprise : adaptation automatique du schéma à l’évolution des documents (notamment aux nouvelles exigences réglementaires), prise en charge de la modification par l’utilisateur et contrôle renforcé. Maintient l’efficacité et la transparence lors du traitement de volumes massifs de données, réduisant ainsi le risque de dysfonctionnement (« boîte noire »). • Impact pratique : Au-delà de la génération de réponses, il optimise les flux de travail complexes tels que l’analyse des tendances financières, la comparaison des fournisseurs ou l’examen des contrats. Exemple : Dans une requête sur le chiffre d’affaires annuel récurrent d’une filiale, S-RAG agrège les données avec précision, évitant ainsi le problème des informations partielles inhérent aux systèmes RAG traditionnels. Les graphiques de performance le quantifient davantage : sur l’ensemble de données aggregate_questions, S-RAG atteint une précision de plus de 85 %, tandis que embedded RAG n’atteint que 25 %.
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.
