A Mistral AI lançou o Mistral OCR 3, um novo modelo que equilibra "alta precisão" e "alta eficiência" no campo do processamento de documentos. Ponto-chave: Não apenas reconhecimento, mas "compreensão". O Mistral OCR 3 não é apenas uma ferramenta tradicional de reconhecimento de texto; é mais como um mecanismo de análise de documentos projetado para a era da IA. • Supera seu antecessor em todos os aspectos: ao processar formulários, documentos digitalizados, tabelas complexas e conteúdo manuscrito, atinge uma taxa de sucesso de 74% em comparação com a geração anterior do OCR 2. Isso significa que reduz significativamente a necessidade de correções manuais. • Capacidades de análise multimodal: Pode extrair não apenas texto, mas também imagens incorporadas. O formato de saída suporta Markdown e utiliza tags HTML para reconstruir com precisão tabelas complexas, o que é crucial para que modelos de IA subsequentes compreendam a estrutura do documento. Avanço tecnológico: superando os "pontos problemáticos" do processamento de documentos. • Reconhecimento de escrita manual: Reproduz com precisão escrita cursiva, anotações com conteúdo misto ou palavras manuscritas sobrepostas a formulários impressos. • Tabelas complexas: Elas podem reter informações estruturais complexas, como cabeçalhos de tabela e linhas e colunas que se estendem por vários eixos, em vez de serem um amontoado de dados sem sentido. • Digitalizações de baixa qualidade: Extremamente resistente a documentos desfocados, distorcidos, ruidosos ou de baixa resolução. • Compreensão de formulários: Identifica com precisão caixas de seleção, rótulos e layouts tipográficos complexos. Valor comercial: Relação custo-benefício extremamente disruptiva A estratégia agressiva de preços do Mistral OCR 3 está impulsionando a adoção em larga escala por empresas: Preço: Apenas US$ 2 por 1.000 páginas. • Desconto por volume: Aproveite um desconto de 50% usando a API em lote, a partir de apenas US$ 1 por 1.000 páginas. Essa estratégia de preços, aliada ao seu alto desempenho, reduz significativamente as barreiras de entrada para que as empresas possam arquivar digitalmente e construir sistemas RAG. Como usar: Desenvolvedores: Pode ser integrado diretamente via API (mistral-ocr-2512). • Usuários regulares: Pode ser usado no Document AI Playground do Mistral AI Studio, com suporte para upload de PDFs ou imagens por meio de arrastar e soltar, e visualização instantânea de texto analisado ou JSON estruturado. Leia o texto original
Carregando detalhes do thread
Buscando os tweets originais no X para montar uma leitura limpa.
Isso normalmente leva apenas alguns segundos.
