DatabricksのAI研究チームによる素晴らしい新機能!3~5倍のコストで最高品質を実現し、GPT-5やClaudeといった主要なVLMよりも優れた性能を発揮するドキュメント解析システムをトレーニングしました。これは、AIを多種多様なデータに接続するために不可欠です。
エンタープライズドキュメントは表、見出し、図などで構成され、非常に複雑です。新しい ai_parse_document はこれらのコンポーネントを確実に識別し、下流のアプリ/エージェントにJSON形式で返します。お客様は、非常に複雑なデータセットでこの機能をテストされています。
SQLやApache Sparkからも簡単に使えるようにしました。ai_parse_documentを呼び出すだけで、大規模なバッチ実行を自動的に処理します。ドキュメントはこちら:https://t.co/AZapO2mPFK

