Automatische Anonymisierung von Gerichtsentscheidungen für E-Justice und Legal-Tech (AnGer)

Sachbericht zum Verwendungsnachweis

dc.contributor.authorEvert, Stephanie
dc.contributor.authorAdrian, Axel
dc.contributor.authorHeinrich, Philipp
dc.contributor.authorDoan Dang, Bao Minh
dc.contributor.authorOdorfer, Daniel
dc.contributor.authorUnjum, Naveed
dc.contributor.authorWerner, Daniel
dc.date.accessioned2026-03-20T05:54:17Z
dc.date.available2026-03-20T05:54:17Z
dc.date.issued2026-03-18
dc.description.abstractDas Forschungsprojekt AnGer beschäftigte sich mit der automatischen Anonymisierung von Gerichtsurteilen. Ziel war die Entwicklung und fundierte Evaluation von Verfahren, mit denen personenbezogene und andere sensible Informationen in Gerichtsurteilen zuverlässig erkannt und anonymisiert werden können. Für die VeröGentlichung von Gerichtsurteilen ist eine korrekte Anonymisierung rechtlich zwingend (vgl. DSGVO). Daher liegt der Fokus auf einem hohen Recall: nahezu alle zu anonymisierenden Textstellen, insbesondere Hochrisikostellen wie Personennamen und Adressen, müssen erkannt werden. Die Precision ist weniger kritisch; überflüssige Maskierungen sind akzeptabel, solange Lesbarkeit und inhaltlicher Zusammenhang erhalten bleiben. Das Projekt knüpft an die Ergebnisse des Vorgängerprojekts LeAK (2020–2022) an. Eine zentrale Erkenntnis aus LeAK war, dass die Erkennung zu anonymisierender Textstellen eGektiv durch Finetuning von Large Language Models (LLMs) gelöst werden kann, hierfür jedoch ein umfangreicher und qualitativ hochwertiger Goldstandard sorgfältig annotierter Trainingsdaten zwingend erforderlich ist. In LeAK konnte für zwei Domänen (aufgefasst als Kombination von Rechtsgebiet und gerichtlicher Instanz) ca. 99% Recall für Hochrisikostellen bei ebenfalls hoher Precision erreicht werden, nämlich amtsgerichtliche Urteile im Miet- und Verkehrsrecht. LeAK zeigte aber auch, dass nahezu perfekte Ergebnisse eben nur von hochspezialisierten Modelle in eng abgegrenzten Domänen erreicht werden können. Vor diesem Hintergrund bestand die zentrale Forschungsaufgabe von AnGer in der Übertragbarkeit auf weitere Domänen. Dazu mussten entsprechende Goldstandards aufgebaut und manuell annotiert werden. Diese bilden die Grundlage für Training und Evaluation der entwickelten Verfahren zur Domänenanpassung.ger
dc.description.versionpublishedVersion
dc.identifier.urihttps://oa.tib.eu/renate/handle/123456789/32893
dc.identifier.urihttps://doi.org/10.34657/31962
dc.language.isoger
dc.publisherHannover : Technische Informationsbibliothek
dc.relation.affiliationFriedrich-Alexander-Universität Erlangen-Nürnberg
dc.rights.licenseCreative Commons Attribution-NonDerivs 3.0 Germany
dc.rights.urihttps://creativecommons.org/licenses/by-nd/3.0/de/
dc.subject.ddc400 | Sprache
dc.subject.ddc000 | Informatik, Information und Wissen, allgemeine Werke
dc.subject.otherAnonymisierungger
dc.subject.otherComputerlinguistikger
dc.subject.otherGerichtsentscheidungenger
dc.subject.otherLLMsger
dc.titleAutomatische Anonymisierung von Gerichtsentscheidungen für E-Justice und Legal-Tech (AnGer)ger
dc.title.subtitleSachbericht zum Verwendungsnachweis
dc.typeReport
dcterms.extent2, 35 Seiten
dtf.duration01.07.2023-14.12.2025
dtf.funding.funderBMFTR
dtf.funding.program16KISA111
tib.accessRightsopenAccess

Files

Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
2026-03_AnGer_Kurzbericht_FINAL.pdf
Size:
71.26 KB
Format:
Adobe Portable Document Format
Description:
Loading...
Thumbnail Image
Name:
2026-03_AnGer_eingehende_Darstellung_FINAL.pdf
Size:
3.25 MB
Format:
Adobe Portable Document Format
Description: