KI-AIM: KI-basierte Anonymisierung in der Medizin
Date
Volume
Issue
Journal
Series Titel
Book Title
Publisher
Link to publishers version
Abstract
Die Entwicklung von modernen KI-Methoden im medizinischen Sektor benötigt eine große Menge von qualitativ hochwertigen und realistischen Daten. Einzelne Einrichtungen besitzen jedoch nur selten eine ausreichende Menge solcher Daten um ein effektives Training durchzuführen. Das Teilen von Daten zwischen Einrichtungen kann daher eine Lösung sein und eine standortübergreifende Datengrundlage schaffen. Daten von Patientinnen und Patienten gehören allerdings zu den besonders schützenswerten Daten, sodass die Datenschutzgrundverordnung (DSGVO) hohe Anforderungen an standortübergreifende Nutzung und Weitergabe der Daten stellt. Gleichzeitig schaffen Gesetze wie das Gesundheitsdatennutzungsgesetz (GDNG) auch eine rechtliche Grundlage und Möglichkeiten der anonymisierten Weitergabe medizinischer Daten. In der Praxis kommen hier zwei Verfahren zur Anwendung: Während die Anonymisierung durch die Transformation der Daten identifizierende Daten verschleiert, greift die Synthetisierung auf generative KI-basierte Verfahren zurück, um fiktive, aber möglichst realitätsnahe Daten, anhand statistischer Merkmale der Originaldaten zu erzeugen. Beide Verfahren besitzen distinktive Stärken, aber auch Limitationen. Die Kombination beider Methoden könnte dazu beitragen gleichzeitig die Privatheit, aber auch die Nutzbarkeit der Daten zu verbessern.
Ziel des Projektes KI-basierte Anonymisierung in der Medizin (KI-AIM) war es ebendiese Fragestellung zu untersuchen und eine Plattform zu entwickeln, welche Anonymisierungsverfahren mit Methoden der synthetischen Datengenerierung kombinieren kann. Die Nutzung einer solchen Plattform kann das datenschutzkonforme Teilen von medizinischen Daten in der Forschung verbessern und somit durch die verbesserte Verfügbarkeit von Trainingsdaten insbesondere bei der Entwicklung von KI-Methoden, unterstützen. In KI-AIM wurde die Plattform Cinnamon entwickelt die Anonymisierungs- und Synthetisierungsverfahren kombiniert ausführen kann und durch eine möglichst einfach nutzbare Oberfläche, die Verfahren auch für Forscherinnen und Forscher zugänglich macht, die keine Anonymisierungsexpert:innen sind. Anhand von standardisierten Bewertungsverfahren, die sich an dem aktuellen Stand der Forschung orientieren, werden Anwender*innen bei der Einschätzung der Qualität und des Restrisikos und somit bei der Entscheidung einer datenschutzkonformen Datennutzung und -weitergabe unterstützt. Des Weiteren wird eine breite Anwendungsmöglichkeit sichergestellt, indem in der Medizin etablierte Datenstandards unterstützt werden. Darüber hinaus wurden Erfolge bei der Interoperabilität, die von der Medizin Informatik Initiative (MII) erzielt wurden, bei der Entwicklung berücksichtigt, indem der international etablierte Datenstandard HL7 FHIR (Fast Healthcare Interoperability Resources) unterstützt wird. Für eine standortübergreifende Analyse wird sichergestellt, dass sämtliche Konfigurationen der Plattform teilbar und somit wiederverwendbar sind. Aus technischer Sicht verfolgt die Plattform einen modularen Aufbau, sodass die Erweiterbarkeit der Plattform gegeben ist und zukünftige Anonymisierungs- und Synthetisierungsverfahren einfach integriert werden können.
Das Institut für Medizinische Informatik (IMI) der Universität Münster (UniMS) trug als Projektkoordinator wesentlich zur Durchführung des Projektes und bei der Entwicklung der Datenschutzplattform Cinnamon bei. Darüber hinaus fokussierte das IMI die Modellierung, Extraktion und Aufbereitung eines zur Evaluation genutzten Datensatzes des Hauttumorzentrums (HTZ) des Universitätsklinikums Münster, den Aufbau einer modularen Infrastruktur zur Eingliederung und zum Management von Anonymisierungs-, Synthetisierungs- und Evaluationskomponenten, die Interoperabilität durch die Nutzung des etablierten HL7 FHIR Standards, sowie die Entwicklung einer intuitiven und geführten Benutzeroberfläche. Gemeinsam mit den Projektpartnern wurde so eine modulare Anwendung geschaffen, die Komponenten zur Anonymisierung, Synthetisierung und Evaluation vereinigt. Die Plattform wurde hinsichtlich ihrer technischen Funktionalität und Nutzbarkeit getestet. Als Basis der technischen Evaluation diente ein realer Datensatz, der anhand eines konkreten Anwendungsfalls aus dem Hauttumorzentrum entwickelt wurde. Ziel war es zu testen, ob beide Methoden auch in der Praxis kombiniert werden können, und welche Kompromisse hinsichtlich der Verwertbarkeit für einen geschützten Datensatz eingegangen werden müssen. Die Nutzer:innenstudie erforschte hingegen die Nutzbarkeit der Plattform, sowie Konzepte der Darstellung und Kommunikation von Restrisiken. Die Cinnamon Plattform wurde für eine freie Verwendung und zur Etablierung einer Community gemeinsam mit einer umfangreichen Dokumentation unter der Apache-2.0 Lizenz veröffentlicht.
