Medinym - KI-basierte Anonymisierung personenbezogener Patientendaten in klinischen Text- und Sprachdatenbeständen
Date
Authors
Editor
Advisor
Volume
Issue
Journal
Series Titel
Book Title
Publisher
Supplementary Material
Other Versions
Link to publishers' Version
Abstract
Im Gesundheitswesen besteht ein Spannungsfeld zwischen der Nutzbarmachung klinischer Text- und Sprachdaten und den hohen Anforderungen an Datenschutz und Datensicherheit. Medinym adressiert dieses Spannungsfeld mit KI-basierten Anonymisierungsverfahren für zwei Domänen: (1) klinische Texte und semi‑strukturierte, longitudinale Daten und (2) Sprachdaten/Sprachakustik. Neben der deutlichen Reduktion der Re‑Identifizierbarkeit ist ein zentrales Ziel, medizinisch relevante Information, insbesondere Diagnostik-Signale in Texten sowie Prosodie und pathologische Marker in Sprachen, für nachgelagerte Verfahren zu erhalten. Im Teilvorhaben Averbis lagen die Schwerpunkte auf der Anonymisierung klinischer Texte und semi‑strukturierter Daten (AP2) - inkl. systematischer Evaluation von PHI‑Erkennung (Listen/Regeln/LSTM/Transformer/LLMs), der gezielten Datenaufbereitung (AP1) sowie auf Verwertungs- und Publikationsstrategie (AP6).
