Databricks bénéficie d'une nouvelle fonctionnalité exceptionnelle, fruit du travail de notre équipe de recherche en IA ! Nous avons entraîné un système d'analyse de documents offrant une qualité optimale à un coût 3 à 5 fois inférieur et surpassant les principaux modèles de langages virtuels comme GPT-5 et Claude. Cette avancée est essentielle pour connecter l'IA à une multitude de types de données.
Les documents d'entreprise sont très complexes et comportent des tableaux, des titres, des figures, etc. La nouvelle fonction ai_parse_document identifie ces éléments avec précision et les renvoie au format JSON pour les applications et agents en aval. Nos clients l'ont testée sur des jeux de données particulièrement difficiles !
Nous l'avons également conçu pour être extrêmement simple d'utilisation depuis SQL ou Apache Spark. Il suffit d'appeler `ai_parse_document` et nous gérondocs.databricks.com/aws/en/sql/lan…cution par lots à grande échelle. Documentation ici : https://t.co/AZapO2mPFK

