Google développe un agent de science des données complet : DS-STAR, capable de gérer des données hétérogènes et d’analyser automatiquement les données, d’écrire du code, de vérifier les erreurs et de générer des résultats. Cela résume l'intégralité du processus de science des données en un seul script accessible en un clic. Pour les utilisateurs métiers qui ne savent pas coder, l'envoi d'un dossier et d'une question suffit à générer un rapport ; pour les data scientists qui savent coder, cet outil peut servir de brouillon automatique, leur évitant ainsi la plupart des tâches répétitives et fastidieuses. Il surpasse AutoGen et DA-Agent dans DABStep, KramaBench et DA-Code : Premièrement, il dispose d'un analyseur de fichiers de données qui scanne le répertoire et génère automatiquement des résumés de champs et sémantiques dans différents formats (CSV, JSON, Markdown, texte brut) comme contexte ultérieur. Le plan est ensuite élaboré et validé de manière itérative. L'agent crée d'abord un code de plan de haut niveau, qu'il transforme en un script exécutable pour validation. Un arbitre basé sur un modèle linéaire à long terme (LLM) évalue si le plan/code actuel permet de résoudre le problème d'optimisation. Si le plan est insuffisant, le routeur guide l'agent pour l'améliorer en modifiant ou en ajoutant des étapes, puis le cycle se répète. Itérer jusqu'à ce que le plan soit considéré comme satisfaisant ou que le nombre maximal d'itérations (10 tours) soit atteint. Les tâches complexes nécessitent en moyenne 5,6 tours pour être résolues ; les tâches simples nécessitent en moyenne 3 tours, plus de la moitié des tâches simples étant terminées dès le premier tour. #Analyse de données IA #DSSTAR #Automatisation de l'analyse de données
Chargement du thread
Récupération des tweets originaux depuis X pour offrir une lecture épurée.
Cela ne prend généralement que quelques secondes.

