Mistral AI 最新發布Mistral OCR 3:在文件處理領域兼顧「高精度」與「高效率」的全新模型 核心亮點:不僅是識別,更是“理解” Mistral OCR 3 不只是一個傳統的文字辨識工具,它更像是一個為AI 時代設計的文檔解析引擎。 · 全面超越前代:在處理表單、掃描件、複雜表格和手寫內容時,它相對於上一代OCR 2 取得了74% 的勝率。這意味著它極大地減少了人工修正的需求。 · 多模態解析能力:它不僅能提取文本,還能提取嵌入的圖像。輸出格式支援Markdown,並利用HTML 標籤精準重建複雜表格,這對於讓後續的AI 模型理解文件結構至關重要。 技術突破:攻克文件處理的“痛點” · 手寫辨識:無論是連筆草書、混合內容的批註,或是覆蓋在列印表單上的手寫字,都能準確還原。 · 複雜表格:能夠保留表頭、跨行跨列等複雜的結構訊息,不再是一堆亂碼。 · 低品質掃描件:對模糊、傾斜、有雜訊或低解析度的文件具有極強的穩健性。 · 表單瞭解:精準辨識複選框、標籤和密集的排版佈局。 商業價值:極具破壞力的性價比 Mistral OCR 3 在定價上極具侵略性,推動大規模企業應用: · 價格:每1,000 頁僅需2 美元。 · 大量折扣:使用Batch-API 可享50% 折扣,低至1 美元/1,000 頁。 · 這項價格策略結合其高性能,大幅降低了企業數位化歸檔和建構RAG 系統的門檻。 如何使用· 開發者:可以透過API (mistral-ocr-2512) 直接整合。 · 一般使用者:可在Mistral AI Studio 的Document AI Playground 中使用,支援拖曳上傳PDF 或圖片,即時檢視解析後的文字或結構化JSON。 閱讀原文
正在載入線程內容
正在從 X 取得原始推文,整理成清爽的閱讀畫面。
通常只需幾秒鐘,請稍候。
