Mistral AI ha lanzado Mistral OCR 3, un nuevo modelo que equilibra "alta precisión" y "alta eficiencia" en el campo del procesamiento de documentos. Lo más destacado: No sólo reconocimiento, sino “comprensión”. Mistral OCR 3 no es solo una herramienta de reconocimiento de texto tradicional; es más bien un motor de análisis de documentos diseñado para la era de la IA. • Supera a su predecesor en todos los aspectos: al procesar formularios, documentos escaneados, tablas complejas y contenido escrito a mano, logra una tasa de éxito del 74% en comparación con la generación anterior OCR 2. Esto significa que reduce significativamente la necesidad de correcciones manuales. • Capacidades de análisis multimodal: Permite extraer no solo texto, sino también imágenes incrustadas. El formato de salida admite Markdown y utiliza etiquetas HTML para reconstruir con precisión tablas complejas, lo cual es crucial para que los modelos de IA posteriores comprendan la estructura del documento. Avance tecnológico: Superar los puntos débiles del procesamiento de documentos • Reconocimiento de escritura a mano: puede reproducir con precisión escritura cursiva, anotaciones con contenido mixto o palabras escritas a mano superpuestas en formularios impresos. • Tablas complejas: pueden retener información estructural compleja, como encabezados de tabla y filas y columnas extendidas, en lugar de ser un montón de galimatías. • Escaneos de baja calidad: extremadamente resistentes a documentos borrosos, torcidos, ruidosos o de baja resolución. • Comprensión de formas: identifica con precisión casillas de verificación, etiquetas y diseños tipográficos densos. Valor comercial: Rentabilidad extremadamente disruptiva La agresiva estrategia de precios de Mistral OCR 3 está impulsando la adopción empresarial a gran escala: Precio: Sólo $2 por 1.000 páginas. • Descuento por volumen: disfrute de un descuento del 50 % utilizando Batch-API, desde tan solo $1 por cada 1000 páginas. Esta estrategia de precios, combinada con su alto rendimiento, reduce significativamente la barrera de entrada para que las empresas archiven y creen digitalmente sistemas RAG. Cómo usarlo: Desarrolladores: Se puede integrar directamente a través de la API (mistral-ocr-2512). • Usuarios regulares: se puede utilizar en Document AI Playground de Mistral AI Studio, que admite la carga de archivos PDF o imágenes mediante arrastrar y soltar, y la visualización instantánea de texto analizado o JSON estructurado. Lea el texto original
Cargando el detalle del hilo
Obteniendo los tweets originales de X para ofrecer una lectura limpia.
Esto suele tardar solo unos segundos.
