31. Januar 2018

OCR-Background-Modul

Das OCR-Background-Modul erkennt den in reinen Bildformaten wie z.B. TIF, JPEG und BMP enthaltenen Text, wandelt ihn in verwertbaren ASCII-Text um und stellt diesen dann für eine Volltextsuche zur Verfügung. Durch die Verwendung der FineReader-Engine wird eine sehr hohe Erkennungsqualität erreicht und dabei sogar das Layout des ursprünglichen Bildes soweit möglich erhalten. Der größte Arbeitsaufwand beim elektronischen Dokumentenmanagement wird durch die Indizierung der Dokumente verursacht. Dieser Schritt ist unumgänglich, da das Auffinden der Dokumente ohne Indizierung bei einem großen Dokumentenbestand nahezu unmöglich wird. In vielen Fällen ist eine Suchmöglichkeit über den gesamten im Dokument enthaltenen Text (die so genannte Volltextsuche) jedoch vollkommen ausreichend. Bei bereits in elektronisch verarbeitbarer Form vorliegenden Dokumenten stellt dies im Gegensatz zu gescannten Dokumenten, die nur als Bild vorliegen, kein größeres Problem dar. Aus den gescannten Dokumenten muss zunächst der Text aus den Bildinformationen extrahiert und dann gespeichert werden. Dieser Vorgang wird als OCR (Optical Character Recognition) bezeichnet. Das OCR-Background-Modul erfüllt diese Anforderung in optimaler Weise. Dokumente, die als reine Bilddatei vorliegen, werden vom Volltext-Indizierungsdienst der integrierten Oracle-Datenbank automatisch und ohne jeglichen manuellen Eingriff an das OCR-Background-Modul übergeben, von diesem dann bearbeitet und die erkannte Textinformation an den Indizierungsdienst zurückgegeben. Somit ist sichergestellt, dass Sie alle Ihre Dokumente unabhängig vom eigentlichen Ursprungsformat nach beliebig enthaltenem Text durchsuchen können. Das OCR-Background-Modul basiert auf der „Abbyy Finereader Engine“ und garantiert dadurch höchste Erkennungsqualität bei hoher Geschwindigkeit. Auch der nachträgliche Einsatz des OCR-Background-Moduls in einer bestehenden softgate-archiv Installation ist ohne Probleme möglich. Die bereits im Archiv abgelegten Dokumente lassen sich auch nachträglich per OCR erkennen und stehen dann ebenfalls zur Volltextsuche zur Verfügung.

Voraussetzungen:
softgate-archiv Version 10 (oder höher), Microsoft Windows Vista oder höher, Oracle Datenbank auf Windows-Plattform

Lizenzierung:
Eine Lizenz pro Archivserver, Lizenzierung nach A4-Seiten pro Monat (eine A3-Seite entspricht 2 A4- Seiten), mind. 25.000 Seiten pro Monat; hierzu zählt neben der Ersterkennung zur Volltextindizierung auch jede Anforderung zur Vorschau mit Highlighting

<script>