Cookie Consent by PrivacyPolicies.com
Contact Us

Kontakt

Ungenutzte OCR-Potenziale richtig freisetzen

Arsalan Saeed

02. Juli 2020

Der Artikel beschäftigt sich mit der neu entwickelten Software „AIP-OCR“ (Advance Image Processing) aus dem Hause weisskopf.twentyone. Insbesondere werden die Herangehensweise und die Funktionen der Software erläutert, gefolgt von einem Anwendungsbeispiel.

Optische Zeichenerkennung (OCR) – Kurz erklärt

Optische Zeichenerkennung, eher bekannt als Optical Character Recognition oder kurz OCR, erkennt Zeichenketten in digitalen Dokumenten (PDF-/ Bild-Format) und überführt diese Zeichen in editierbare Texte. Dies geschieht auf Pixelebene: Verschiedene Zeichen werden erkannt und anhand von Algorithmen in Wörter bzw. ganze Texte interpretiert.

Vorteile der OCR

Eingescannte Dokumente sind anhand OCR wieder zugänglich und können bei Bedarf angepasst werden. Dadurch entfällt die Transkription des Dokuments durch den Mitarbeiter. Mittlerweile nutzen bereits viele Firmen die OCR-Technologie. Bekannte Beispiele sind sicherlich Google, Amazon und Microsoft.

Wo kommt OCR zum Einsatz?

Die Einsatzgebiete von OCR reichen von der Logistikbranche bis hin zur Finanzwirtschaft. Nehmen wir als Beispiel die Digitalisierung und Archivierung von Akten. In diesem Fall kann der Text der eingescannten Dokumente durch die OCR-Software bzw. OCR-Engine extrahiert werden und in ein beliebiges Dokumentenformat wie bspw. „.docx“ oder „.txt“ abgespeichert werden, so dass das eingescannte Dokument als Text zur Verfügung steht.

Herausforderungen der OCR-Technologie

Das generierte Textdokument ist nicht immer zu 100 % akkurat. Störfaktoren wie Pixelrausch („Noise“) und/ oder eine schlechte Bildqualität des Ursprungsdokumentes vermindern die Transkriptionsqualität und produzieren dadurch fehlerhafte Wörter. Anhand des nachfolgenden Beispiels sehen Sie, dass die Verwendung der OCR-Engine „Tesseract“ ohne „AIP“ („Advance Image Processing“) sich als problematisch erweist, da nicht jedes Zeichen korrekt erkannt wird.

Lösungsansätze und Weiterentwicklungen

Typischer Ablauf der „AIP-OCR“-Verarbeitung:

„AIP-OCR“ ermöglicht die Entfaltung des vollen OCR-Potenzials

Wir bei weisskopf.twentyone haben speziell für die Verbesserung der OCR-Genauigkeit eine neue Software entwickelt, welche die Präzision durch „Advance Image Processing (AIP)“ erhöht. Die OCR-Genauigkeit ist abhängig von der Bildqualität. Das heißt: Je höher die Qualität des Bildes, desto besser der resultierende Text. Die passgenaue Anpassung durch die Software erlaubt eine kostengünstigere Alternative zu den teuren am Markt etablierten OCR-Tools.

Wie funktioniert die „AIP-OCR“-Software?

  1. Die Software scannt den Quellordner und listet alle Bilder auf.
  2. Jedes Bild wird im angegebenen Verzeichnis verarbeitet.
  3. OCR wird auf das verarbeitete Bild angewandt.
  4. Der „Grammar-Check“ korrigiert mögliche Fehler im resultierenden Text.
  • Gewährleistung der Datenintegrität: Das Ursprungsbild, das AIP-OCR bearbeitete Bild und Textdatei werden in separaten Ordner gespeichert.
  • Parametrisierte Bild-Optimierung: Anpassung erfolgt je nach Ausgangslage des Bildes.
  • Verbesserung durch AIP-OCR: Das Bild wird auf Eigenschaften wie scharfe Zeichengrenzen, hoher Kontrast, gut ausgerichtete Zeichen und wenig Pixelrausch („Noise“) geprüft und ggf. verbessert.

Ergebnis: AIP-OCR liefert einen nahezu fehlerfreien Text.

Abbildung 4: AIP-OCR Ergebnisse

Der Grammar-Check: Text-Korrektur leicht gemacht – Hohe Qualität im Ergebnis

Im allgemeinem Fall impliziert der Einsatz von OCR eine gewisse Fehlermarge. Selbst wenn das Bild korrekt verarbeitet wurde, können allein durch das „Pre-Processing“ nicht alle Fehlerquellen beseitigt werden. Solche Ausnahmefälle abzufangen, gestaltet sich auf Anhieb schwierig, doch weisskopf.twentyone bietet für diese Fälle eine Lösung an. Die Nutzung des „Grammar-Checks“, welcher die Wörter auf Richtigkeit prüft, ist multilingual einsetzbar und bei entsprechend guter Bildqualität, bietet der Einsatz von AIP-OCR in Kombination mit dem „Grammar-Check“ eine optimale Lösung für die Verarbeitung von Dokumenten.

Das Bild wurde durch „AIP-OCR“ verarbeitet und weicht visuell vom Ursprungsbild (s. Abbildung 1) in puncto Schärfe und Kontrast deutlich ab.


Der resultierende Text wurde noch keinem Grammar-Check unterzogen und enthält trotz Optimierungen einige Fehler.


Das optimale Ergebnis erzielt die Software „AIP-OCR“ durch die Anwendung des „Grammar-Checks“ auf den Text und dieser korrigiert annähernd alle Fehler.


Gerne gehen wir bei Interesse weiter ins Detail! Wir freuen uns über Ihre Kontaktaufnahme unter info@weisskopf21.com.

Weitere Interessante Artikel…

4.8 4 votes
Article Rating
guest
0 Comments
Inline Feedbacks
View all comments