Skilja Technologien für Document Understanding

Kategorien:

Die Verwendung der LAERA-Komponenten von Skilja ermöglicht die Informationsextraktion ähnlich der menschlichen Leseart. LAERA ist eines der fortschrittlichsten und bewährten Extraktionssysteme, das so lesen kann, wie man es von völlig inhaltsfreien Inhalten wie Verträgen bis hin zu halbstrukturierten Rechnungen wie klassischen Formularen und OMR tun würde.

Der Laera Classifier verfügt über angepasste KI-Methoden (künstliche Intelligenz), die speziell für Geschäftsprozesse entwickelt wurden, um Dokumente zu verstehen und jedem Prozess kontinuierliches Online-Lernen hinzuzufügen.

LESA OCR ist eine auf neuralen Netzwerken basierende Volltexterkennungs-Engine. Durch eine Layout-Analyse werden nicht nur Textblöcke, sondern auch erweiterte Eigenschaften wie Schrift-Typ (Hand/Machine Print), Textrichtung und Durchstreichungen erkannt. Durch das Training mit mehreren Millionen Beispielen werden auch bei schlechter Bildqualität gute Erkennungsraten erreicht. Unterstützt sind Zahlen, die Zeichensätze vieler europäischer Sprachen und gebräuchliche Sonderzeichen.

Als Erweiterung für LAERA ist diese OCR eine auf neuralen Netzwerken basierende zonale Texterkennung, die als Bestandteil von Laera Information Extraction zur Verfügung gestellt wird. Die Engine ist optimal für den Einsatz auf Farbbildern und benötigt keine aufwändige Bild-Vorverarbeitung um Formularinhalte von Formularobjekten wie Kämmen, Boxen und Linien zu unterscheiden. Die Erkennung gedruckter und handgeschriebener Texte liefert neben einer verlässlichen Konfidenz auch Informationen über Durchstreichungen.

Durch die langjährige Entwicklungspartnerschaft zwischen Skilja und der ic-solution Gruppe sind alle Technologien von Skilja als vollintegraler Bestandteil in SPICE BPM nutzbar.

Mehr Infos finden Sie hier: www.skilja.de

Zurück zur Übersicht
crossmenu