ENGAGE - Next generation computing environments for artificial intelligence

Abstract

Das deutsch-französische Kooperationsprojekt (Okt. 2021 - Nov. 2024) ENGAGE - NExt GeNeration ComputinG Environments for Artificial Intelligence - bearbeitet Grundlagen für den effizienten und breiten Einsatz und Betrieb von maschinellem Lernen (ML) sowie für die Gewinnung der notwendigen Trainings- und Testdaten. In 3 Arbeitspaketen wurden ausgewählte Themen aus den verschiedenen technischen Ebenen eines optimierten ML-Einsatzes bearbeitet. Auf der Daten- und Anwendungsebene adressierte das Projekt die Frage, ob und wie bei komplexen neuronalen Modellen ein Adaptive Sampling eines Parameterraumes dazu beitragen kann, möglichst aussagekräftige Daten auszuwählen. Ebenso wurde untersucht, wie Simulationen aufgebaut sein müssen, um große Mengen aussagekräftiger, hinreichend variierter, synthetischer Zeitseriendaten aus dem Bereich IoT/Smart Living für ML-Trainings zu generieren. Auf der Optimierungs-Ebene wurde untersucht, wie Virtualisierung und Scheduling aufgebaut und genutzt werden können, um neuronale Modelle effizient in heterogenen, ggfs. verteilten Hardware-Umgebungen unterschiedlichster Leistungsklassen, CPU- wie auch GPU- basiert laufen zu lassen. Zudem wurden Compiler-basierte Strategien für die Optimierung der Speicherressourcen für die Parallelisierung entwickelt. Auf der Deployment-Ebene wurden neue Cross-Platform-Deployments sowie umfangreiche Ansätze für ML-Pipelines entwickelt und in mehreren Anwendungsdomänen erprobt. Die durchgeführten Arbeiten umfassen möglichst einfach zu handhabende Workflows für Modellerstellung und Test, schnelles Onboarding für neue Nutzende der aufgebauten ML-Umgebung, ein integriertes Tracking/Versionierung der ML-Experimente, nahtloses Deployment von Runtimes und Modellen, Skalierung von ML-Jobs in einer Clusterumgebung sowie ein Echtzeitmonitoring für laufende Jobs. Auf der Ebene Runtime and Compute wurde untersucht, wie im laufenden Betrieb Modelldegradationen und mögliche Angriffe der Datenübertragungswege in föderierten ML-Umgebungen zu detektieren sind.

Description

Keywords

License

Creative Commons Attribution-NonDerivs 3.0 Germany