Product Launch2026-06-26VentureBeat

Mistral OCR 4: Dokumente intelligent verstehen

Mistral AI hat OCR 4 veröffentlicht, die neueste Version seines Dokumenten-Intelligence-Modells. Es wurde entwickelt, um die Art und Weise zu verändern, wie Unternehmen Informationen aus Dokumenten extrahieren und verarbeiten. Anders als herkömmliche OCR-Systeme, die einfach Bilder in Text umwandeln, liefert OCR 4 strukturierte Repräsentationen ganzer Dokumente – komplett mit Bounding Boxes, Blocktyp-Klassifikation und Konfidenzwerten für jedes einzelne Wort. Diese vierte Generation stellt einen bedeutenden Sprung für Mistral dar, das seine OCR-Fähigkeiten seit der Gründung des Unternehmens stetig verbessert hat. Die neue Version ist für Enterprise-Anwendungsfälle optimiert, bei denen Genauigkeit und Struktur oberste Priorität haben. „Dokumente sind das Lebensblut von Unternehmen, aber sie sind oft unübersichtlich und unstrukturiert“, sagte ein Mistral-AI-Manager. „OCR 4 geht über die reine Textextraktion hinaus. Es versteht das Layout, identifiziert Überschriften, Absätze, Tabellen und Abbildungen und liefert Konfidenzwerte für jedes Wort. Das ermöglicht es nachgelagerten Systemen, fundierte Entscheidungen über die Datenqualität zu treffen.“ Das Modell ist besonders nützlich für Branchen mit hohem Dokumentenaufkommen, wie Finanzen, Recht, Gesundheitswesen und Logistik. Eine Versicherung könnte OCR 4 beispielsweise nutzen, um Schadensformulare automatisch zu verarbeiten – dabei nicht nur den Text extrahieren, sondern auch die räumlichen Beziehungen zwischen Feldern. Eine Anwaltskanzlei könnte Verträge mit präzisen Bounding Boxes für Unterschriften und Klauseln digitalisieren. Mistral hat auch die Fähigkeit des Modells verbessert, mit schwierigen Dokumenten umzugehen, darunter solche mit schlechter Beleuchtung, schrägen Winkeln oder komplexen Schriftarten. Die Konfidenzwerte pro Wort ermöglichen es Entwicklern, unsichere Extraktionen für eine manuelle Überprüfung zu markieren, was Fehler reduziert, ohne die Automatisierung zu opfern. Die Veröffentlichung erfolgt in einem zunehmend wettbewerbsintensiven Enterprise-KI-Markt, in dem auch Google, Microsoft und Amazon Dokumenten-KI-Dienste anbieten. Mistral differenziert sich durch Open-Source-freundliche Lizenzierung und On-Premises-Bereitstellungsoptionen, was Organisationen mit strengen Anforderungen an die Datenhoheit anspricht. OCR 4 ist jetzt über die Mistral-API und als herunterladbares Modell für selbst gehostete Umgebungen verfügbar. Das Unternehmen plant, weiterzuentwickeln; zukünftige Versionen sollen mehr Sprachen und Dokumenttypen unterstützen.

Verwandte Nachrichten