X (Twitter)

Mistral AI 最新發布Mistral OCR 3：在文件處理領域兼顧「高精度」與「高效率」的全新模型核心亮點：不僅是識別，更是“理解” Mistral OCR 3 不只是一個傳統的文字辨識工具，它更像是一個為AI 時代設計的文檔解析引擎。 · 全面超越前代：在處理表單、掃描件、複雜表格和手寫內容時，它相對於上一代OCR 2 取得了74% 的勝率。這意味著它極大地減少了人工修正的需求。 · 多模態解析能力：它不僅能提取文本，還能提取嵌入的圖像。輸出格式支援Markdown，並利用HTML 標籤精準重建複雜表格，這對於讓後續的AI 模型理解文件結構至關重要。技術突破：攻克文件處理的“痛點” · 手寫辨識：無論是連筆草書、混合內容的批註，或是覆蓋在列印表單上的手寫字，都能準確還原。 · 複雜表格：能夠保留表頭、跨行跨列等複雜的結構訊息，不再是一堆亂碼。 · 低品質掃描件：對模糊、傾斜、有雜訊或低解析度的文件具有極強的穩健性。 · 表單瞭解：精準辨識複選框、標籤和密集的排版佈局。商業價值：極具破壞力的性價比 Mistral OCR 3 在定價上極具侵略性，推動大規模企業應用： · 價格：每1,000 頁僅需2 美元。 · 大量折扣：使用Batch-API 可享50% 折扣，低至1 美元/1,000 頁。 · 這項價格策略結合其高性能，大幅降低了企業數位化歸檔和建構RAG 系統的門檻。如何使用· 開發者：可以透過API (mistral-ocr-2512) 直接整合。 · 一般使用者：可在Mistral AI Studio 的Document AI Playground 中使用，支援拖曳上傳PDF 或圖片，即時檢視解析後的文字或結構化JSON。閱讀原文

來自 meng shao（@shao__meng）的推文串

作者資訊

推文串內容