Creative Commons Attribution-NonDerivs 3.0 GermanyFlores-Herr, Nicolas2025-12-042025-12-042025-12-03https://oa.tib.eu/renate/handle/123456789/27008https://doi.org/10.34657/26240Das Projekt FedXtract zielt darauf ab, eine föderierte Lernumgebung für die automatisierte Verarbeitung komplexer Fahrzeugdokumente zu schaffen. Control€xpert, Condat und Fraunhofer entwickelten gemeinsam ein System, das Rechnungen, Berichte und Kostenvoranschläge aus Schadensfällen effizient analysieren kann. Als technologisches Rückgrat dient das Open-Source-Framework Nvidia FLARE, das sowohl verteilte Partner-Server als auch Simulationen unterstützt. Durch diese Architektur wird ein globales Modell trainiert, ohne dass sensible Daten zwischen den Partnern ausgetauscht werden müssen. Im Rahmen des Projekts wurden verschiedene Dokumentenmodelle evaluiert; aufgrund seiner Fähigkeit, Text- und Layoutinformationen in vielen Sprachen zu verarbeiten, fiel die Wahl auf das Modell LayoutXLM. Eine harmonisierte Datenpipeline stellt sicher, dass heterogene Quellen in ein einheitliches Format (JSON/JSONL mit Layout-Koordinaten) überführt werden und durch Qualitätskontrollen belastbare Trainings-, Validierungs- und Testsplit-Sets entstehen. Mit über 1 000 goldgelabelten Dokumenten aus dem Fraunhofer-Datensatz und weiteren Partnerdaten konnte ein Deep-Learning-Modell entwickelt werden, das die Genauigkeit der Extraktion deutlich steigert. Die Ergebnisse belegen, dass sich das System mit jeder Trainingsrunde verbessert und flexibel um weitere Datenquellen erweitern lässt. Eine Verwertungsplanung zeigt, wie die gewonnenen Erkenntnisse zeitnah in Versicherungsprozessen und weiteren Anwendungen wie Edge-Geräten oder internationale Pilotprojekte eingebunden werden sollen.ger000 | Informatik, Information und Wissen, allgemeine WerkeFedXtract - Föderierte KI-Lösung zur Verarbeitung komplexer Dokumente; Teilvorhaben: AP3 Entwicklung eines Deep Learning-basierten Modells für den Use Case Document Recognition, AP4 Content für Training und EvaluationReport9 SeitenBMBF-Verbundprojekt - FedXtract-Schlussbericht 2025