Databricks 推出由我们人工智能研究团队支持的全新强大功能!我们训练了一套文档解析系统,它以 3-5 倍的成本提供一流的解析质量,并且性能优于 GPT-5 和 Claude 等领先的虚拟语言模型 (VLM)。这对于将人工智能与各种类型的数据连接起来至关重要。
企业文档非常复杂,包含表格、标题、图表等,而新的 ai_parse_document 功能可以可靠地识别这些组件,并以 JSON 格式返回给下游应用程序/代理。客户已经在一些非常复杂的数据集上对其进行了测试!
我们也让它在 SQL 或 Apache Spark 中使用起来非常简单。只需调用 ai_parse_document,我们就能自动处理大规模批量执行。文档在此:https://t.co/AZapO2mPFK

