Automatische Anonymisierung von Gerichtsentscheidungen für E-Justice und Legal-Tech (AnGer)

Evert, Stephanie; Adrian, Axel; Heinrich, Philipp; Doan Dang, Bao Minh; Odorfer, Daniel; Unjum, Naveed; Werner, Daniel

doi:https://doi.org/10.34657/31962

Automatische Anonymisierung von Gerichtsentscheidungen für E-Justice und Legal-Tech (AnGer)

Sachbericht zum Verwendungsnachweis

dc.contributor.author	Evert, Stephanie
dc.contributor.author	Adrian, Axel
dc.contributor.author	Heinrich, Philipp
dc.contributor.author	Doan Dang, Bao Minh
dc.contributor.author	Odorfer, Daniel
dc.contributor.author	Unjum, Naveed
dc.contributor.author	Werner, Daniel
dc.date.accessioned	2026-03-20T05:54:17Z
dc.date.available	2026-03-20T05:54:17Z
dc.date.issued	2026-03-18
dc.description.abstract	Das Forschungsprojekt AnGer beschäftigte sich mit der automatischen Anonymisierung von Gerichtsurteilen. Ziel war die Entwicklung und fundierte Evaluation von Verfahren, mit denen personenbezogene und andere sensible Informationen in Gerichtsurteilen zuverlässig erkannt und anonymisiert werden können. Für die VeröGentlichung von Gerichtsurteilen ist eine korrekte Anonymisierung rechtlich zwingend (vgl. DSGVO). Daher liegt der Fokus auf einem hohen Recall: nahezu alle zu anonymisierenden Textstellen, insbesondere Hochrisikostellen wie Personennamen und Adressen, müssen erkannt werden. Die Precision ist weniger kritisch; überflüssige Maskierungen sind akzeptabel, solange Lesbarkeit und inhaltlicher Zusammenhang erhalten bleiben. Das Projekt knüpft an die Ergebnisse des Vorgängerprojekts LeAK (2020–2022) an. Eine zentrale Erkenntnis aus LeAK war, dass die Erkennung zu anonymisierender Textstellen eGektiv durch Finetuning von Large Language Models (LLMs) gelöst werden kann, hierfür jedoch ein umfangreicher und qualitativ hochwertiger Goldstandard sorgfältig annotierter Trainingsdaten zwingend erforderlich ist. In LeAK konnte für zwei Domänen (aufgefasst als Kombination von Rechtsgebiet und gerichtlicher Instanz) ca. 99% Recall für Hochrisikostellen bei ebenfalls hoher Precision erreicht werden, nämlich amtsgerichtliche Urteile im Miet- und Verkehrsrecht. LeAK zeigte aber auch, dass nahezu perfekte Ergebnisse eben nur von hochspezialisierten Modelle in eng abgegrenzten Domänen erreicht werden können. Vor diesem Hintergrund bestand die zentrale Forschungsaufgabe von AnGer in der Übertragbarkeit auf weitere Domänen. Dazu mussten entsprechende Goldstandards aufgebaut und manuell annotiert werden. Diese bilden die Grundlage für Training und Evaluation der entwickelten Verfahren zur Domänenanpassung.	ger
dc.description.version	publishedVersion
dc.identifier.uri	https://oa.tib.eu/renate/handle/123456789/32893
dc.identifier.uri	https://doi.org/10.34657/31962
dc.language.iso	ger
dc.publisher	Hannover : Technische Informationsbibliothek
dc.relation.affiliation	Friedrich-Alexander-Universität Erlangen-Nürnberg
dc.rights.license	Creative Commons Attribution-NonDerivs 3.0 Germany
dc.rights.uri	https://creativecommons.org/licenses/by-nd/3.0/de/
dc.subject.ddc	400 \| Sprache
dc.subject.ddc	000 \| Informatik, Information und Wissen, allgemeine Werke
dc.subject.other	Anonymisierung	ger
dc.subject.other	Computerlinguistik	ger
dc.subject.other	Gerichtsentscheidungen	ger
dc.subject.other	LLMs	ger
dc.title	Automatische Anonymisierung von Gerichtsentscheidungen für E-Justice und Legal-Tech (AnGer)	ger
dc.title.subtitle	Sachbericht zum Verwendungsnachweis
dc.type	Report
dcterms.extent	2, 35 Seiten
dtf.duration	01.07.2023-14.12.2025
dtf.funding.funder	BMFTR
dtf.funding.program	16KISA111
tib.accessRights	openAccess

Files

Original bundle

Now showing 1 - 2 of 2

Name:: 2026-03_AnGer_Kurzbericht_FINAL.pdf
Size:: 71.26 KB
Format:: Adobe Portable Document Format
Description:

Download

Name:: 2026-03_AnGer_eingehende_Darstellung_FINAL.pdf
Size:: 3.25 MB
Format:: Adobe Portable Document Format
Description:

Download

Collections

Forschungsberichte Pflichtabgabe (BMFTR, BMWE…)