FedXtract - Föderierte KI-Lösung zur Verarbeitung komplexer Dokumente; Teilvorhaben: AP3 Entwicklung eines Deep Learning-basierten Modells für den Use Case Document Recognition, AP4 Content für Training und Evaluation

dc.contributor.authorFlores-Herr, Nicolas
dc.date.accessioned2025-12-04T09:02:24Z
dc.date.available2025-12-04T09:02:24Z
dc.date.issued2025-12-03
dc.description.abstractDas Projekt FedXtract zielt darauf ab, eine föderierte Lernumgebung für die automatisierte Verarbeitung komplexer Fahrzeugdokumente zu schaffen. Control€xpert, Condat und Fraunhofer entwickelten gemeinsam ein System, das Rechnungen, Berichte und Kostenvoranschläge aus Schadensfällen effizient analysieren kann. Als technologisches Rückgrat dient das Open-Source-Framework Nvidia FLARE, das sowohl verteilte Partner-Server als auch Simulationen unterstützt. Durch diese Architektur wird ein globales Modell trainiert, ohne dass sensible Daten zwischen den Partnern ausgetauscht werden müssen. Im Rahmen des Projekts wurden verschiedene Dokumentenmodelle evaluiert; aufgrund seiner Fähigkeit, Text- und Layoutinformationen in vielen Sprachen zu verarbeiten, fiel die Wahl auf das Modell LayoutXLM. Eine harmonisierte Datenpipeline stellt sicher, dass heterogene Quellen in ein einheitliches Format (JSON/JSONL mit Layout-Koordinaten) überführt werden und durch Qualitätskontrollen belastbare Trainings-, Validierungs- und Testsplit-Sets entstehen. Mit über 1 000 goldgelabelten Dokumenten aus dem Fraunhofer-Datensatz und weiteren Partnerdaten konnte ein Deep-Learning-Modell entwickelt werden, das die Genauigkeit der Extraktion deutlich steigert. Die Ergebnisse belegen, dass sich das System mit jeder Trainingsrunde verbessert und flexibel um weitere Datenquellen erweitern lässt. Eine Verwertungsplanung zeigt, wie die gewonnenen Erkenntnisse zeitnah in Versicherungsprozessen und weiteren Anwendungen wie Edge-Geräten oder internationale Pilotprojekte eingebunden werden sollen.ger
dc.description.versionpublishedVersion
dc.identifier.urihttps://oa.tib.eu/renate/handle/123456789/27008
dc.identifier.urihttps://doi.org/10.34657/26240
dc.language.isoger
dc.publisherHannover : Technische Informationsbibliothek
dc.relation.affiliationFraunhofer Institut für Intelligente Analyse- und Informationssysteme IAIS
dc.rights.licenseCreative Commons Attribution-NonDerivs 3.0 Germany
dc.subject.ddc000 | Informatik, Information und Wissen, allgemeine Werke
dc.titleFedXtract - Föderierte KI-Lösung zur Verarbeitung komplexer Dokumente; Teilvorhaben: AP3 Entwicklung eines Deep Learning-basierten Modells für den Use Case Document Recognition, AP4 Content für Training und Evaluationger
dc.title.subtitleBMBF-Verbundprojekt - FedXtract-Schlussbericht 2025
dc.typeReport
dc.typeText
dcterms.event.datevon November 2022 bis April 2024
dcterms.extent9 Seiten
dtf.funding.funderBMFTR
dtf.funding.program01IS21037C
dtf.funding.program16IS21037C
dtf.funding.verbundnummer01240357
dtf.version1

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
FedXtract_Schlussbericht-2023-IAIS_final.pdf
Size:
448.81 KB
Format:
Adobe Portable Document Format
Description: