Verbundvorhaben FedXtract - Föderierte KI-Lösung zur Verarbeitung komplexer Dokumente - Sachbericht 2024

Loading...
Thumbnail Image

Volume

Issue

Journal

Series Titel

Book Title

Publisher

Hannover : Technische Informationsbibliothek

Link to publishers version

Abstract

Jedes Jahr werden immer noch Milliarden von Dokumenten aufwändig manuell verarbeitet, wie z.B. in der Schadenabwicklung bei Versicherungen. Nachdem diese bisher aufgrund der großen Bandbreite von Dokumentenlayouts und (Scan-) Qualität nur bedingt mit Standardmethoden zur Texterkennung und -interpretation analysiert werden konnten, ermöglichen die neu aufkommenden KI-Verfahren zur Dokumenterkennung nun eine automatische Verarbeitung. Bei kleineren Organisationen wie KMUs scheitert deren Einsatz jedoch noch daran, dass zum Training der KI-Modelle umfangreiche Datenmengen benötigt werden. Eine gemeinsame Entwicklung der Modelle durch verschiedene Unternehmen ist dabei kaum möglich, weil sie die Datenhoheit der Beteiligten verletzen würde. Weiterhin fehlt vielen Organisationen noch das Know-How, um KI-Modelle selbst zu trainieren und einzusetzen. FedXtract adressiert all diese Herausforderungen und schafft eine Lösung, mit deren Hilfe Organisationen ohne komplexes KI Know-How in die Lage versetzt werden, gemeinsam unter Wahrung der Datenhoheit KI-Modelle zu trainieren und das gemeinsame Modell auf den individuellen Anwendungsfall anzupassen. In dieser Lösung wird mittels sog. Föderierten Lernens (FL) eine unternehmensübergreifende, kontinuierliche Verbesserung eines globalen KI-Modells durch mehrere, verteilte Anwender ermöglicht. Dabei werden lediglich die inkrementellen Verbesserungen der Modelle ausgetauscht, so dass die sensiblen Daten lokal bleiben. Jeder Anwender kann dann in einem anschließenden Schritt ein User-spezifisches KI-Modell entwickeln, indem das globale, gemeinsame Modell über sog. Transfer Learning (TL) für den eigenen Anwendungsfall optimiert wird. Weitere Details unter: https://www.fedxtract.net/

Description

Keywords

License

CC BY-NC-ND 3.0 DE