KI-AIM - KI-basierte Anonymisierung in der Medizin
Date
Volume
Issue
Journal
Series Titel
Book Title
Publisher
Link to publishers version
Abstract
Die Forschung und Entwicklung von KI-Methoden im Gesundheitswesen ist in besonderem Maße auf große Mengen qualitativ hochwertiger, realistischer Daten angewiesen, die in der klinischen Versorgung über längere Zeiträume erhoben und dokumentiert werden. Gleichzeitig ist der Zugang zu diesen Daten häufig eingeschränkt, da es sich um sensible, personenbezogene und oft stark heterogene Daten handelt, deren Nutzung strengen datenschutzrechtlichen Anforderungen unterliegt. Dies erschwert insbesondere die Sekundärnutzung für Forschung und Entwicklung von datengetriebenen Anwendungen und führt in der Praxis zu hohem organisatorischen Aufwand, langen Abstimmungsprozessen und begrenzter Verfügbarkeit geeigneter Daten.
Vor diesem Hintergrund ist das Gesamtziel des Verbundprojekts KI-basierte Anonymisierung in der Medizin (KI-AIM) die Entwicklung und Etablierung einer Anonymisierungsplattform, die die Bereitstellung großer Mengen realitätsnaher Daten ermöglicht, die keinen Personenbezug aufweisen und dadurch datenschutzrechtlich einfacher genutzt werden können. Dadurch soll der Zugang zu Daten für die Entwicklung von KI-Methoden deutlich vereinfacht und damit sowohl die Forschung als auch die Entwicklung entsprechender Anwendungen unterstützt werden. Kern des Vorhabens ist die Entwicklung der KI-AIM-Plattform Cinnamon. Die Plattform kombiniert Anonymisierungs- und Synthetisierungsverfahren über standardisierte Schnittstellen, unterstützt die Ausführung in unterschiedlichen Konfigurationen und zugleich die Bewertung der Ergebnisse anhand von Qualitäts- und Risikoindikatoren. Des Weiteren ist die KI-AIM-Plattform Cinnamon generisch ausgelegt und erweiterbar, sodass zusätzliche Verfahren, entlang einer definierten Schnittstellenspezifikation integriert werden können.
Das Teilprojekt des DFKI verfolgt innerhalb dieses Rahmens vier zentrale Ziele. Die Zugänglichmachung ausgewählter Anonymisierungs- und Synthetisierungsansätze innerhalb der gemeinsamen Plattform, die Erforschung ihrer Kombinierbarkeit unter Berücksichtigung semantischer Abhängigkeiten, die Abbildung verschiedener Kombinationsmöglichkeiten in einer für Domänenexpertinnen und Domänenexperten nutzbaren Konfiguration sowie die Entwicklung und Integration von Verfahren zur Messung der Nützlichkeit anonymisierter und synthetischer Daten. Ein starker Fokus liegt dabei auf der Datensynthese, insbesondere auf Deep-Learning-basierten Ansätzen wie Generative Adversarial Networks (GANs), und autoregressiven Modellen (AR) sowie auf wissensbasierten Verfahren der Prozessmodellierung und Simulation.
Als konkreter Anwendungsfall wird die KI-Forschung zur Entwicklung klinischer Entscheidungsunterstützungssysteme in der dermatologischen Onkologie adressiert. Gerade onkologische Behandlungsdaten sind aufgrund ihrer Komplexität, Heterogenität und Diversität schwer zu anonymisieren und zu synthetisieren, zugleich besteht ein hoher Bedarf an datenschutzkonform nutzbaren Daten für Forschung und Entwicklung. Im Rahmen der Evaluation wird daher überprüft, inwieweit anonymisierte und synthetisierte Daten im Vergleich zu Originaldaten für ausgewählte medizinische Use Cases nutzbar sind und welche Risiken dabei in Kauf genommen werden müssen. Ergänzend wird die Gebrauchstauglichkeit der Plattform in einer Usability-Evaluation untersucht. Die Plattform wurde unter der Apache-2.0 (Open-Source-Lizenz) veröffentlicht, um Nachnutzung, Weiterentwicklung und Transfer insbesondere auch in Richtung Industrie zu ermöglichen.
