Product Launch2026-06-26VentureBeat

Mistral、文書構造を理解する「OCR 4」公開 企業向けデータ抽出を高度化

Mistral AIが、文書インテリジェンスモデルの最新版「OCR 4」をリリースしました。これは企業が文書から情報を抽出・処理する方法を変革するために設計されています。画像をテキストに変換するだけの従来の光学文字認識(OCR)システムとは異なり、OCR 4はバウンディングボックス、ブロックタイプ分類、単語ごとの信頼度スコアを含む、文書全体の構造化表現を返します。 この第4世代モデルは、Mistralが創業以来着実にOCR機能を改善してきた中での大きな飛躍を示しています。新しいバージョンは、精度と構造が何よりも重要となるエンタープライズユースケース向けに最適化されています。 Mistral AIの幹部は「文書はビジネスの生命線ですが、しばしば乱雑で非構造化されています。OCR 4は単なる生のテキスト抽出を超えています。レイアウトを理解し、見出し、段落、表、図を識別し、すべての単語に信頼度スコアを提供します。これにより、下流のシステムがデータ品質について情報に基づいた決定を下せるようになります」と述べています。 このモデルは、金融、法務、医療、物流など、大量の文書を扱う業界で特に有用です。例えば、保険会社はOCR 4を使用して請求書を自動処理し、テキストだけでなくフィールド間の空間的関係も抽出できます。法律事務所は、署名や条項の正確なバウンディングボックスを使って契約書をデジタル化できます。 Mistralはまた、照明が不十分な文書、斜めの角度、複雑なフォントなど、困難な文書を処理するモデルの能力も向上させています。単語ごとの信頼度スコアにより、開発者は不確かな抽出結果を人間によるレビューに回すことができ、自動化を犠牲にすることなくエラーを削減できます。 このリリースは、エンタープライズAI市場がますます競争激化する中で行われ、Google、Microsoft、Amazonなどのプレーヤーがすべて文書AIサービスを提供しています。Mistralは、オープンソースに配慮したライセンスとオンプレミス展開オプションに焦点を当てることで差別化を図り、厳格なデータ主権要件を持つ組織にアピールしています。 OCR 4は現在、MistralのAPIおよびセルフホスト環境向けのダウンロード可能なモデルとして利用可能です。同社は今後も改良を続け、将来のバージョンではより多くの言語と文書タイプをサポートする予定です。

関連ニュース