Product Launch2026-06-26VentureBeat

Mistral AI lança OCR 4 para extração inteligente de documentos

A Mistral AI lançou o OCR 4, a mais recente iteração de seu modelo de inteligência para documentos, projetado para transformar a forma como as empresas extraem e processam informações de documentos. Diferente dos sistemas tradicionais de reconhecimento óptico de caracteres (OCR), que simplesmente convertem imagens em texto, o OCR 4 retorna representações estruturadas de documentos inteiros, completas com caixas delimitadoras, classificação de blocos e pontuações de confiança por palavra. Esta quarta geração do modelo representa um avanço significativo para a Mistral, que vem aprimorando constantemente suas capacidades de OCR desde a fundação da empresa. A nova versão é otimizada para casos de uso empresarial, onde precisão e estrutura são fundamentais. "Documentos são a espinha dorsal dos negócios, mas muitas vezes são confusos e não estruturados", disse um executivo da Mistral AI. "O OCR 4 vai além da extração bruta de texto. Ele entende o layout, identifica títulos, parágrafos, tabelas e figuras, e fornece pontuações de confiança para cada palavra. Isso permite que sistemas downstream tomem decisões informadas sobre a qualidade dos dados." O modelo é particularmente útil para setores que lidam com grandes volumes de documentos, como finanças, direito, saúde e logística. Por exemplo, uma seguradora pode usar o OCR 4 para processar automaticamente formulários de sinistros, extraindo não apenas o texto, mas também as relações espaciais entre os campos. Um escritório de advocacia pode digitalizar contratos com caixas delimitadoras precisas para assinaturas e cláusulas. A Mistral também melhorou a capacidade do modelo de lidar com documentos desafiadores, incluindo aqueles com iluminação ruim, ângulos inclinados ou fontes complexas. As pontuações de confiança por palavra permitem que desenvolvedores sinalizem extrações incertas para revisão humana, reduzindo erros sem sacrificar a automação. O lançamento ocorre em um momento em que o mercado de IA empresarial se torna cada vez mais competitivo, com players como Google, Microsoft e Amazon oferecendo serviços de IA para documentos. A Mistral se diferencia ao focar em licenciamento de código aberto e opções de implantação local, atraindo organizações com requisitos rigorosos de soberania de dados. O OCR 4 já está disponível através da API da Mistral e como um modelo para download em ambientes auto-hospedados. A empresa planeja continuar iterando, com versões futuras previstas para suportar mais idiomas e tipos de documentos.

Notícias relacionadas