KI-Nachwuchsgruppe "MultiML: Multikriterielles Maschinelles Lernen - Effizienz, Robustheit, lnteraktivität und Systemwissen"
Sachbericht gemäß Nr 4.1 NABF
Date
Authors
Editor
Advisor
Volume
Issue
Journal
Series Titel
Book Title
Publisher
Supplementary Material
Other Versions
Link to publishers' Version
Abstract
Das Dilemma, dass konfliktäre Kriterien von gleicher oder ähnlich großer Bedeutung sind, tritt in allen Bereichen aus Technik, Wirtschaft und Gesellschaft auf. So ist es z. B. gewünscht, dass elektrische Fahrzeuge gleichzeitig schnell fahren und eine hohe Reichweite haben, dass ein Produkt eine hohe Qualität bei niedrigen Produktionskosten aufweist, oder dass bei politischen Entscheidungen ökonomische, ökologische und wirtschaftliche Aspekte berücksichtigt werden. In allen Beispielen besteht die Herausforderung darin, optimale Kompromisslösungen (sogenannte Pareto-Optima, benannt nach Vilfredo Pareto) zu identifizieren und auszuwählen. Auch im maschinellen Lernen lässt sich auf ganz natürliche Weise eine Vielzahl bestmöglich zu erfüllender Kriterien formulieren, z.B. die Minimierung des Trainingsfehlers, eine bestmögliche Generalisierung über die Trainingsdaten hinaus, Robustheit gegenüber gestörten / fehlerhaften / unvollständigen Eingangsdaten, numerische Effizienz, die bestmögliche Einhaltung physikalischer (oder anderer) Gesetzmäßigkeiten, die bestmögliche Interpretierbarkeit des trainierten Modells. Der zentrale Forschungsaspekt der Nachwuchsgruppe war die Entwicklung problemspezifischer Mehrzieloptimierungsmethoden, die das Training tiefer neuronaler Netze robuster, effizienter und interaktiver machen. Darüber hinaus gibt es insbesondere in technischen Anwendungen häufig umfangreiches Systemwissen, was auf den zweiten wichtigen Punkt führt: Wie können Mehrzieloptimierungsverfahren entwickelt bzw. genutzt werden, um Expertenwissen zu verschiedenen Graden zu berücksichtigen? Die Beantwortung dieser Fragen erforderte Grundlagenforschung in den Bereichen Optimierung, Maschinelles Lernen sowie datengetriebene Ingenieurwissenschaften & Physik, weshalb die Forschungsfragen in drei Teilprojekten durchgeführt wurde:
- Die Entwicklung effizienter multikriterieller Optimierungsverfahren für tiefe neuronale Netze
- Die graduelle Einbindung physikalischer Gesetzmäßigkeiten in den Trainingsprozess
- Effizienz und Strukturausnutzung für besonders große Probleme
